openMP多线程程序运行时部分线程故障,怎么办?

l4kangaxx 2014-01-15 04:44:14
加精
小弟在地震物理研究所工作,我们的程序算法需要用到大型服务器集群,代码用openMPI来实现并行,但是大型服务器集群么,运算一个地震算法2天很正常吧,期间只要一块cpu或者gpu 宕机,整个算法就没结果了,这很惨啊,我们队地震算法很熟悉,但是openmpi就一般般了,所以请教一下,这种情况是否在openMPI的架构中有对应解决方案?
...全文
912 22 打赏 收藏 转发到动态 举报
写回复
用AI写文章
22 条回复
切换为时间正序
请发表友善的回复…
发表回复
nzmbzdn 2014-02-11
  • 打赏
  • 举报
回复
romanwang2 2014-02-05
  • 打赏
  • 举报
回复
可以考虑考虑里面的间隔等
shiter 2014-02-02
  • 打赏
  • 举报
回复
搞成云计算平台嘛,哈哈
beyondcj 2014-01-31
  • 打赏
  • 举报
回复
beyondcj 2014-01-24
  • 打赏
  • 举报
回复
副组长 2014-01-23
  • 打赏
  • 举报
回复
这个就的自己设计了,没什么好办法。比方每个线程搞个开关量什么的,回收时检查所有线程状态。对没完成的重新配置任务等。总之办法是有的。
kfckaifengcai 2014-01-23
  • 打赏
  • 举报
回复
引用 16 楼 wan212000 的回复:
这个确实高端 而且是第一次 帮楼主顶一个
云满笔记 2014-01-23
  • 打赏
  • 举报
回复
这个确实高端 而且是第一次 帮楼主顶一个
lk12k2 2014-01-22
  • 打赏
  • 举报
回复
引用 楼主 lion_kangaxx 的回复:
小弟在地震物理研究所工作,我们的程序算法需要用到大型服务器集群,代码用openMPI来实现并行,但是大型服务器集群么,运算一个地震算法2天很正常吧,期间只要一块cpu或者gpu 宕机,整个算法就没结果了,这很惨啊,我们队地震算法很熟悉,但是openmpi就一般般了,所以请教一下,这种情况是否在openMPI的架构中有对应解决方案?
哇哇哇哇
hugh_z 2014-01-22
  • 打赏
  • 举报
回复
learning
frmqjqxrpqzg 2014-01-22
  • 打赏
  • 举报
回复
  • 打赏
  • 举报
回复
suibianfuhuiyigeba
哈哈哈谁说 2014-01-22
  • 打赏
  • 举报
回复
回家国防科技华工科技高合金钢
心是菩提树 2014-01-21
  • 打赏
  • 举报
回复
第一次听说
545696 2014-01-21
  • 打赏
  • 举报
回复
nettman 2014-01-21
  • 打赏
  • 举报
回复
帮顶
哥特帝景 2014-01-21
  • 打赏
  • 举报
回复
u010936661 2014-01-21
  • 打赏
  • 举报
回复
梧桐芭蕉 2014-01-21
  • 打赏
  • 举报
回复
这个很高端,等高人了。

566

社区成员

发帖
与我相关
我的任务
社区描述
英特尔® 边缘计算,聚焦于边缘计算、AI、IoT等领域,为开发者提供丰富的开发资源、创新技术、解决方案与行业活动。
社区管理员
  • 英特尔技术社区
  • shere_lin
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧