OneFlow：从头开始重新设计分布式深度学习框架

OneFlow深度学习框架

企业官方账号

2021-11-01 14:11:08

加精

#OneFlow：从头开始重新设计分布式深度学习框架# TensorFlow 和 PyTorch 等深度学习框架提供了一个高效的API接口，用于在单个设备上训练 DNN 模型或使用数据并行。即便如此，在分布式设备上训练大规模型模型时，原有深度学习框架不够灵活、高效，这需要比数据并行更复杂的并行性。这些框架开发了插件来强化这些框架在模型或流水并行的能力，但这使得分布式深度学习的使用和实现进一步复杂化。

为此，一流科技研发出具有各种并行范式的OneFlow#分布式深度学习框架# ，基于 SBP（split, broadcast和partial-value）抽象和actor模型而开发。SBP 使数据并行和模型并行的编程比现有框架更容易，并且actor提供了一套简洁的运行时机制来管理分布式深度学习中的资源约束、数据搬运和计算所施加的复杂依赖关系。

通过案例研究和大量实验证明，#OneFlow# 在训练各种大型 #DNN# 模型方面的普遍适用性和效率。结果表明，OneFlow 的性能优于许多建立在原有框架之上的知名定制库。

#深度学习# #机器学习# #TensorFlow# #PyTorch#

论文：https : //arxiv.org/pdf/2110.15032.pdf；代码： https : //github.com/Oneflow-Inc/oneflow

...全文

1084 回复打赏收藏转发到动态举报

写回复

回复

切换为时间正序

请发表友善的回复…

发表回复

这是OneFlow社区发布的第48期AI系统前沿动态。《AI系统前沿动态》主要推荐AI系统、编译器、大模型、硬件、最新活动等相关内容，每周一期。

作为一家由多位前Google TPU开发者组建的芯片公司，Groq一经成立便备受关注。2016年底，曾领导研发Google张量处理单元（TPU，用于加速机器学习而定制的芯片）的Jonathon Ross离职创办了Groq，他们希望能为AI和HPC工作负载提供毫不妥协的低延迟和高性能。不同于传统的CPU和GPU架构，Groq从头设计了一个张量流处理器 (TSP...

一流科技申报的“OneFlow分布式深度学习框架”凭借领先的科技创新能力、扎实的技术实力与对行业发展趋势的预判能力获得组委会认可，斩获本次大赛的最高奖项——总决赛优胜奖。

点击上方“机器学习与生成对抗网络”，关注"星标"获取有趣、好玩的前沿干货！如何评价清华大学发布的自研深度学习框架-计图(Jittor)？2020年3月20日，清华自研的深...

Datawhale干货来源：OneFlow翻译：沈佳丽、胡燕君、贾川前言为什么芯片设计需要很长时间？能不能加速芯片设计周期？能否在几天或几周之内完成芯片的设计？这是一个非常有野心的目标。过去十年，机器学习的发展离不开系统和硬件的进步，现在机器学习正在促使系统和硬件发生变革。Google在这个领域已率先出发。在第58届DAC大会上，Google AI负责人Jeff Dean分享了《机器学习在硬...

OneFlow深度学习框架

222

社区成员

262

社区内容

发帖

与我相关

我的任务

学习其他企业社区

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章