在终端侧部署大语言模型时,Qualcomm 设备常用哪些模型压缩与推理加速技术?
Qualcomm 设备针对端侧 LLM 部署的核心技术围绕 “压缩体积、提升算力效率、降低延迟” 设计,主流技术如下:
6,212
社区成员
5,975
社区内容
加载中
试试用AI创作助手写篇文章吧