高通 AI Edge Box 多进程同时调用 NPU,出现进程抢占导致推理任务随机中断,如何做算力隔离?
采用单进程统一调度 NPU 推理会话,所有业务进程通过消息队列分发任务;为核心业务分配独立 NPU 算力分片,限制普通进程最大算力占用;添加任务中断重试机制,防止抢占造成推理异常退出。
7,644
社区成员
6,338
社区内容
加载中
试试用AI创作助手写篇文章吧