集群搭建-torque计算节点接收任务后不执行
拾毅者 2015-01-29 01:57:06 集群安装没问题,单机多cpu工作也没问题
可是有了子节点后,子节点能够扫描到任务,但是就是不执行,追踪任务报如下错误
unable to run job, MOM rejected/rc=-1
unable to run job, send to MOM '10.10.12.128' failed
计算节点就是不工作,qnodes检查 都是free状态,ssh也没问题,防火墙也关着
在Google搜了好久,这个问题一大串,可是没有一个解决方案,看到CSDN上也有人问过,可是也没答案
想问问有谁搭过torque碰到这问题的么?能不能帮帮忙,解救一下,这问题折腾我几天了