4,650
社区成员




高通在生成式AI领域有哪些核心技术布局,如何将其与移动设备芯片(如骁龙平台)结合以提升用户体验?
高通(Qualcomm)在生成式AI领域的布局主要围绕以下核心技术及移动端应用展开:
混合AI架构:
高通倡导“混合AI”策略,即结合云端与终端设备的协同计算。其骁龙移动平台(如骁龙8 Gen 3)搭载专用的AI引擎(Hexagon处理器),支持在终端高效运行生成式AI模型(如Stable Diffusion、Meta Llama 2等),减少延迟和隐私风险。
硬件加速能力:
Hexagon NPU:通过张量加速和微切片推理技术,提升大语言模型(LLM)和扩散模型的运行效率。例如,骁龙8 Gen 3可在手机端实现每秒20 tokens的Llama 2-7B模型推理速度。
dreno GPU:优化生成式AI的并行计算,支持图像/视频实时生成与编辑。
软件工具链支持:
提供AI Stack、Qualcomm AI Engine Direct等工具,帮助开发者优化生成式AI模型在骁龙平台的部署,支持PyTorch、ONNX等框架。
应用场景落地:
影像增强:如实时照片扩展(Generative Fill)、AI降噪。
语音与文本:本地化AI助手、实时翻译。
游戏:NPC动态对话生成(与Unity合作)。
用户体验提升:
通过终端侧生成式AI,用户获得更快的响应速度、更强的隐私保护(数据无需上传云端)以及离线可用性(如野外实时翻译)。未来,高通计划将生成式AI扩展至XR(AR/VR)、汽车等领域,进一步强化边缘计算优势。
案例:2024年小米14 Ultra搭载骁龙8 Gen 3,支持本地运行AI图像生成功能,用户可实时编辑照片背景而无须联网。