刘强-NPU性能优化、评估和实践

m0_74120090 2024-12-12 10:14:48

课时名称课时知识点
刘强-NPU性能优化、评估和实践刘强 腾讯大数据软硬件协同技术专家 演讲主题 NPU性能优化、评估和实践 在NPU规格定义和架构探索阶段,通过深度学习框架(Pytorch/TensorFlow)中成熟的Trace和Metrics等采样信息构建基于timeline的CPU、GPU和分布式通信的执行路径,结合厂商仿真出的不同算子的workload的执行时间预测NPU的端到端训练性能,弥补互联网企业在早期评估NPU性能出现的偏差和评测手段不足的问题。 通过对NPU计算和存储资源的抽象,屏蔽了不同NPU厂商微架构的实现差异,并探索了基于编译方式实现的硬件抽象的路径。
...全文
38 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

1

社区成员

发帖
与我相关
我的任务
社区管理员
  • m0_74120090
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧