可以直接使用第三方推理引擎吗?llama.cpp 或者nexa
看这里,有很多支持高通NPU的模型
https://sdk.nexa.ai/model?acceleration=Qualcomm
建议使用目前已有的模型,其他vl,reranker、bge在最近会发布。其他模型如果确实没有可以使用第三方
6,717
社区成员
6,111
社区内容
加载中
试试用AI创作助手写篇文章吧