做边端质检时,模型从 PyTorch 导出到高通部署链路里最容易卡在哪,怎么规避?
常见卡点是算子兼容性、动态 shape、以及量化后精度回退。建议先将模型结构规整为部署友好拓扑(减少不必要分支和自定义算子),再做分层量化校准;同时用 QNN 的 profiling 工具逐层定位耗时和精度损失点,迭代替换高成本算子。
7,156
社区成员
6,214
社区内容
加载中
试试用AI创作助手写篇文章吧