1 less /var/log/messages 查看宕机时间段前后的日志,是否有crash,内存泄露,进程无法回收,空间满类似的报错,如果有根据具体报错查,如果是crash, 查前后是否有进程锁住,内存泄露,系统无法响应等,都可以在messages里面看见
2 如果是人为重启,除了系统里last |grep -i reboot可以查到重启命令,也可通过messages里面查看进程是否有single 15 一类的关健字,15信号是进程强制中断,一般拔电源,硬件问题,系统问题,都会出现这个提示,出现这个提示后关机了,排查硬件是否亮红灯,dmesg是否有error, 如果是系统问题会在messages里面有明显的kenel信息,比较方便排查。 如果都不是,就是掉电了。
3 如果关机了,但是messages里面没日志 ,就查/var/log/cron, 在宕机时间段前后,是否有正常的进程在跑,来判断机器是否在关机前已经挂了,再来就是用sar类的命令查看机器负载