章程瑞东、姜慧强-如何在高度并行化的设备上利用大模型的稀疏性进行优化

m0_74120090 2024-12-12 10:14:47

课时名称课时知识点
章程瑞东、姜慧强-如何在高度并行化的设备上利用大模型的稀疏性进行优化章程瑞东、姜慧强 微软亚洲研究院研发工程师 演讲主题 如何在高度并行化的设备上利用大模型的稀疏性进行优化 漫长的训练与推理过程及其带来的高昂算力成本是当前大语言模型推广所面临的主要挑战之一。大量研究显示,大语言模型的计算负荷呈现出高度稀疏化的特点,这为降低算力成本提供了一定契机。然而,以 GPU 为代表的并行计算基础设施在执行稀疏计算时存在明显的效率问题,如何在并行计算设备上实现高效的稀疏计算是一个普遍存在的难题,稀疏计算的需求对传统的算子编程范式和模型编译系统也提出了新的挑战。
...全文
55 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

1

社区成员

发帖
与我相关
我的任务
社区管理员
  • m0_74120090
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧