高通 AI Edge Box 部署多套生成式 AI 模型,切换模型时出现加载卡顿,该如何优化切换速度?
采用模型预加载与内存驻留方案,将常用模型常驻内存;利用 QNN 模型分片加载技术,拆分大模型资源按需调取;设置模型后台静默切换机制,避开前台业务高峰,减少切换带来的卡顿与等待时长
7,642
社区成员
6,322
社区内容
加载中
试试用AI创作助手写篇文章吧