高通在轻量化生成式AI模型部署中,主要从哪些层面对模型与算子进行优化?
高通从模型量化、算子融合、内存复用、硬件亲和性算子优化等层面提升生成式AI在终端上的运行效率,降低算力与带宽需求。
7,639
社区成员
6,296
社区内容
加载中
试试用AI创作助手写篇文章吧