7,639
社区成员
发帖
与我相关
我的任务
分享最近在做高通NPU量化转换时,由于模型内存在for循环结构,如果让onnx将其转换成Loop算子,进一步转换成ir_graph的适合就会报错“No translation registered for op type onnx_loop”。
已尝试2.31和2.44的QNN,报错信息相同。
如果不用loop算子、for循环会被完整展开,导致onnx节点过多,无法进行后续量化等操作。
想请问一下各位,有支持loop的QNN吗?如果需要自己定义的话,能否顺利进行后续量化、编译、端侧推理等流程呢?

目前公开版 QNN(含你用的 2.31/2.44)不原生支持onnx_loop/for 循环算子,根本原因是高通 NPU 为静态数据流架构,不支持动态控制流。
核心解决路径
模型侧改造:
尽量用固定次数循环,提前在模型中展开(避免生成 ONNX Loop 算子);
改用 NPU 友好的实现,比如用Unroll或用Tile/Reshape替代动态循环。
自定义算子适配:
可通过 QNN 的 Op API 自定义Loop算子,但后续量化、编译、端侧推理需自行适配,且性能 / 兼容性风险高。