HPC多节点并行计算错误

saj3469063 2020-08-17 11:38:22
在安装并行计算是,针对MPICH3.3.2 的测试例子,用mpirun多节点并行机计算测试成功,但是并行计算wrf.exe时始终跑一会就中断了,报一以下的错误:
d01 2020-08-14_00:00:00 grid spacing, dt, time_step_sound= 9000.000 27.00000 4
d01 2020-08-14_00:00:00 call rk_step_prep
d01 2020-08-14_00:00:00 calling inc/HALO_EM_A_inline.inc
Fatal error in PMPI_Wait: Unknown error class, error stack:
PMPI_Wait(203)........................: MPI_Wait(request=0x4de87f4, status=0x7fff5ad13c20) failed
MPIR_Wait_impl(100)...................:
MPIDU_Complete_posted_with_error(1137): Process failed

有没有哪位大神可以看看如何解决吗?试了各种方法,换版本,修改ulmit参数配置等就是不行
...全文
415 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
weixin_44366597 2023-03-06
  • 打赏
  • 举报
回复

同问,楼主有解决吗?

2,408

社区成员

发帖
与我相关
我的任务
社区描述
高性能计算
社区管理员
  • 高性能计算社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧