用S4000训练pytorch架构下的模型,占用显存极高,同样的参数和配置在3090上可以训练,但是在S4000上会爆显存,MUSA是否支持混合精度训练?求解答!
168
社区成员
83
社区内容
加载中
试试用AI创作助手写篇文章吧