在 QCS6490 平台上,除了模型量化外,还采用了哪些硬件特异性优化(如内存分配、多核调度或功耗管理)来进一步提升实时性?
内存优化:利用QCS6490的共享内存池减少DSP与CPU间数据拷贝,预分配输入/输出张量内存。功耗管理:通过高通PowerSDK动态调节NPU频率,在持续推理时锁定高频,间歇任务启用DVFS节能。多核调度:将模型分片到4个A78大核处理计算密集型层(如Conv),A55小核处理后处理逻辑。
4,509
社区成员
5,845
社区内容
加载中
试试用AI创作助手写篇文章吧