1,209
社区成员
发帖
与我相关
我的任务
分享
《模型并行 —— 构建和部署大型神经网络》
实时授课答疑 | GPU 实验环境 | NVIDIA 培训证书 | 3 折 GTC 特惠
✅以Megatron和DeepSpeed为例,训练超大模型,实现在多节点多GPU上运行,优化计算和通信效率
✅亲手完成CV和NLP模型训练、以及大模型通过Triton的部署与应用
超大型的深度神经网络 (DNN),无论是用于自然语言处理 (如 GPT-3)、计算机视觉 (如规模巨大的视觉 Transformer),还是语音 AI (如 Wave2Vec 2),都具有区别于其较小规模同类模型的特殊属性。基于海量数据集训练出来的 DNN 的规模越来越大,使得它们只需再经过少量示例训练就能够适应新任务要求,从而加快了向通用人工智能的迈进。使用庞大的数据集,训练包含数百亿到千亿参数的模型并非易事,这需要独特的方法来综合运用人工智能、高性能计算 (HPC) 和系统知识。本课程的目标就是学习如何训练超大型的神经网络并将其部署到生产中。
【学习目标】
完成本课程后,您将能够:
【课程安排】
【如何报名】
席位有限,先到先得哦~~~