这个确实高端 而且是第一次 帮楼主顶一个
小弟在地震物理研究所工作,我们的程序算法需要用到大型服务器集群,代码用openMPI来实现并行,但是大型服务器集群么,运算一个地震算法2天很正常吧,期间只要一块cpu或者gpu 宕机,整个算法就没结果了,这很惨啊,我们队地震算法很熟悉,但是openmpi就一般般了,所以请教一下,这种情况是否在openMPI的架构中有对应解决方案?
566
社区成员
7,027
社区内容
加载中
试试用AI创作助手写篇文章吧