6,429
社区成员
发帖
与我相关
我的任务
分享模型转换的完整pipeline是怎样的?从训练到部署中间有哪些坑要注意?
qairt-converter 将 ONNX 转为浮点 DLC(QNN 图格式);qairt-quantizer 做 INT4/FP16 量化(配校准数据防掉点);qnn-context-binary-generator 转量化 DLC 为 Context-Binary(NPU 可执行);qnn-context-binary-utility --check 扫描。qnn-net-run --profile 测延迟/功耗,adb logcat 排查初始化失败。