关于MPI运行时问题

shawn102 2007-06-27 01:19:50
1.我登录到ssh c0-7计算节点,运行程序后一段时间,会显示“Connection to c0-7 closed.”然后需要重新登陆,重新启动MPICH2。或者是另外一种情况:运行数分钟后出现“job aborted; reason = mpd disappeared”,这时候节点没有关闭,可是需要重启mpd。这是什么原因呢?是环境配置的问题吗?
2.譬如我开了50个进程,运行开始时顺利,后来出现这种语句“rank 46 in job 1 compute-0-1.local_37850 caused collective abort of all ranks exit status of rank 46: killed by signal 9 ”是什么意思?
...全文
876 6 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
6 条回复
切换为时间正序
请发表友善的回复…
发表回复
milex 2008-09-30
  • 打赏
  • 举报
回复
牛人没我帅 帅的没我牛 呵呵
tomato_potato 2008-09-28
  • 打赏
  • 举报
回复
支持
treetor 2008-09-27
  • 打赏
  • 举报
回复
出来逛逛 学习学习
converf 2008-09-25
  • 打赏
  • 举报
回复
很有道理值得学习
lehedele 2008-09-24
  • 打赏
  • 举报
回复
期待
mairon 2008-07-31
  • 打赏
  • 举报
回复
该问题我也出现了,谁能帮忙解决??

568

社区成员

发帖
与我相关
我的任务
社区描述
英特尔® 边缘计算,聚焦于边缘计算、AI、IoT等领域,为开发者提供丰富的开发资源、创新技术、解决方案与行业活动。
社区管理员
  • 英特尔技术社区
  • shere_lin
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧