datanode,regionserver,zookeeper同时挂掉且无日志记录的怪现象
额,今天查看hadoop状态,发现有台服务器的datanode,regionserver,zookeeper一起挂掉了,而其他服务器却没有任何问题。
master,regionserver,zookeeper日志无任何记录;datanode日志显示到22:45后就没任何记录;namenode日志在22:45左右也没有说datanode是loseheart还是怎么回事,总之也无任何提示,同时日志记录显示这台服务器在22:45就没有任何数据流入流出了,感觉像是namenode在这一刻就不认识这台datanode,所以要备份时就不会想到它了。
还有个现象是zookeeper,regionserver不知道为什么就只有一个启动日志记录,无任何其他记录了,在datanode宕掉之前10个小时都无任何问题,说明防火墙,conf配置,域名什么的应该都没问题。
我想到的一个原因是网络突然断了,使得这台服务器成为了孤立的一台服务器了。
所以,我想问下有没有什么可能可以让这三者都死掉?
一个人的想法太少了,征求下同志们的想法,呵呵~~~~