加速边缘侧的生成式AI的发展

chipseeker 2024-01-02 16:19:16

加精

随着 ChatGPT等LLM模型，Stable Diffusion，Midjourney等LVM模型火爆，生成式AI大模型浪潮席卷全球。

国际上OpenAI的chatgpt4 , Google的Gemini ,Meta的Llama，国内国内，包括百度、阿里巴巴、百川智能及智谱AI在内的一众大厂和创新公司也在不断发力追赶国外进度。

然而这些LLM/LVM大模型的部署和运行，动辄就是部署在云端大算力的GPU加速卡，普通的开发者有心无力。

生成式AI与边缘侧、终端侧设备相结合，降低运行成本、加快响应速度，对于生成式AI的商业落地有着重要促进作用。高通的SOCNPU、GPU和CPU，正在力推生成式AI浪潮从云端向边缘与终端侧延伸。

基于高通SOC的Fast Stable Diffusion能够在一秒内生成图像

基于高通SOC的Llama2的AI 助手最快能达到20 tokens/s

具体的内容和demo详见以下链接

Accelerating generative AI at the edge | Knowledge distillation & Quantization | Qualcomm

...全文

1873 1 打赏收藏转发到动态举报

写回复

1 条回复

切换为时间正序

请发表友善的回复…

发表回复

prajina99 2024-01-11

打赏
举报

回复

可以跑开源的CPU版本的LLM-ggml？

半导体电子行业行业分析数据分析数据报告行业报告

生成式人工智能（Generative AI）作为一种革命性的技术，近年来在各个领域中掀起了深刻的变革。从最初的概念萌芽到如今的广泛应用，生成式人工智能的发展历程充满了突破与挑战。生成式人工智能的起源可以追溯到20世纪中叶，当时的计算机科学家们开始探索如何让计算机模拟人类的创造力。这一过程最早体现在规则基础的生成模型中，如早期的图像生成和文本生成模型。然而，真正的突破发生在2010年代，尤其是在深度学习的快速发展之下。

摘要以ChatGPT为代表的生成式人工智能应用引起信息产业新浪潮，也催生了对算力、通信、安全等的新挑战，而以云计算、边缘计算、通信网络技术为支撑的算网融合代表了未来通算一体的发展趋势。生成式AI与算网融合的双向赋能，有望克服算力与通信瓶颈，实现生成式AI应用更加广泛的推广，同时有望推动算网融合架构向智能化方向发展。分析了生成式AI与算网融合的概念、现状及趋势，思考了生成式AI应用对算网融合的诉求以及生成式AI技术对算网融合架构的赋能作用。引言近期，以ChatGPT为代表的生成式人工智能

本文来源：智车科技引言在互联网与物联网（IoT）深度融合的今天，人工智能（AI）技术的加持让网络服务日趋便捷化、个性化和智能化。而生成式AI（Generative AI）的崭露头角正在为诸多行业带来新的机遇和潜力。然而，当前AI技术的普及在很大程度上仍依赖于云端大型服务器和高性能算力，从而限制了其服务的范围与深度。为突破这一瓶颈，各大厂商都在积极布局边缘AI。像Hailo等致力于推动AI技术边界高...

本文详解生成式人工智能与大模型的本质区别，涵盖技术原理、应用场景及核心差异点，帮助读者系统理解AI领域的核心概念与发展趋势。

高通开发者论坛

5,133

社区成员

5,906

社区内容

发帖

与我相关

我的任务

人工智能物联网机器学习技术论坛（原bbs）北京·东城区

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章