在工业相机的边缘检测场景中,高通平台上如何把INT8量化模型部署到NPU并减少精度损失?
可优先采用“量化感知训练(QAT)+代表性校准数据集”的方式导出模型,再通过高通AI推理工具链将关键算子映射到NPU执行。对易掉点层(如检测头、激活函数附近)保留更高精度或做混合精度,通常能在功耗可控前提下兼顾吞吐和精度。
7,463
社区成员
6,230
社区内容
加载中
试试用AI创作助手写篇文章吧