超级诡异的问题,服务器间断性不通
bugx 2009-11-28 10:48:50 硬件配置
dell R610
网卡
01:00.0 Ethernet controller: Broadcom Corporation NetXtreme II BCM5709 Gigabit Ethernet (rev 20)
01:00.1 Ethernet controller: Broadcom Corporation NetXtreme II BCM5709 Gigabit Ethernet (rev 20)
02:00.0 Ethernet controller: Broadcom Corporation NetXtreme II BCM5709 Gigabit Ethernet (rev 20)
02:00.1 Ethernet controller: Broadcom Corporation NetXtreme II BCM5709 Gigabit Ethernet (rev 20)
IP:10.1.1.106
操作系统
CentOs 5.3 64位
应用软件
mysql nginx php
网络结构:
106,107,108 千兆线链接交换机,106,108之间有一根双绞线互联,用的第二块网卡。
问题描述:
23号突然3台服务器全部挂掉。106,107,108 后来去检查是交换机问题,内网ping值奇高,后来换了台新的交换机。107,108恢复正常。
106后来几天还是会突然断线。发现情况是106能够ping通自己,但是ping不通其他机器和网关,arp -a 无法获得网关mac.其他机器也无法ping通这台机器。
然后从108通过SSH链接上106(第二块网卡的双绞线),ifdown eth0,ifup eth0. 无效,问题依旧。只有service network restart 问题解决。
问题分析:
23号出问题前,做过的设置,就是加了NFS,和一些PHP缓存上的设置,cgi从端口方式改为socket。出问题后,又禁用了NFS,把设置全部改为原来状态,但是问题依旧。
流量也没有异常,抓包分析arp也没有发现有网段内arp病毒欺骗。
还有一次,第二块网卡也有一次出现类似情况,那时候第二块网卡正在用NFS。
能ping通自己,说明网卡还活着,那么出现问题是什么导致的呢?请各位高手解惑啊,