7,639
社区成员
发帖
与我相关
我的任务
分享在AI PC场景中,Windows应用如何把本地OCR+翻译链路稳定跑在NPU上,而不是回退CPU?
关键是“模型兼容性+运行时约束”双校验:
1)先确认OCR与翻译模型算子均被NPU后端支持;
2)加载模型时显式设置NPU优先执行策略;
3)对不支持算子提前做图优化或拆子图,避免运行时临时回退;
4)加入启动自检日志,输出每层实际执行后端;
5)在发布包中固定依赖库版本,避免驱动与Runtime不一致导致隐式回退。
生产中建议设置回退告警阈值,一旦CPU占比超限即触发诊断上报。