6,429
社区成员
发帖
与我相关
我的任务
分享想请教一下 QAIRT 的生态建设现状:目前有没有类似 Hugging Face 这种“模型社区/模型动物园”的入口,能让我们快速找到已经针对骁龙平台做过适配与优化、并且可以直接在 QAIRT 上跑的模型(比如已经完成转换、校准、量化、算子适配、可在 NPU/HTP 上稳定运行的版本)?
如果有的话,这类资源一般以什么形式发布(model zoo、示例工程、预编译模型包、参考 pipeline 等)?以及如何判断一个模型是否真的“端侧可用”(例如支持哪些 SoC、哪些精度、是否会回退到 CPU、性能数据是否有参考基线)?
QAIRT无独立类Hugging Face社区,核心入口是高通Hugging Face专区、模型广场、GitHub示例仓库,提供骁龙NPU/HTP预优化模型。资源以预量化Context - Binary/DLC包、示例工程、参考pipeline发布。判断端侧可用:看骁龙8 Gen2+适配,INT4/FP16精度,用工具查无CPU回退,对比延迟/功耗/内存基线,优先官方验证版。