公司使用了一个hadoop机器,大概有10台机器。
hadoop是HA模式
hbase有两个master(主备),regionserver有5台
情况:前天,往hbase写了大概有300-500w数据,结果造成hbase启动不了。
报错情况如下:
意思是hbase在做split wal的时候出错了,然后hmaster就把regionserver关闭了
后来,我又去看hdfs的日志,就是报错:get corruput log等等
输入hadoop fsck -openforwrite
报错如下:
可以看出有很多corrupt文件处理openforwrite状态。
我手动的删除了,在/hbase/WALs下面的corrupt文件,hbase可以启动了。但是只要hbase一启动,就又会产生这些corrupt文件,问题依然存在。
请大神来帮帮忙,非常感谢!!