SQL SERVER 群集问题

navy887 2011-09-19 09:43:28
我的SQL SERVER 群集做的是AA模式。
环境是 WIN2008 R2 + SQL SERVER 2008 R2

现在发现断电以后,群集可以自动切换。但是断网后不能自动切换,只有手动切换才可以。

大家有这种情况吗?

SQL SERVER 是不是确实有这种问题?还是有什么方法可以解决?

请教大家这个会是哪里的问题?
...全文
347 25 打赏 收藏 转发到动态 举报
写回复
用AI写文章
25 条回复
切换为时间正序
请发表友善的回复…
发表回复
navy887 2011-10-11
  • 打赏
  • 举报
回复
结贴!!!
Clarence 2011-09-20
  • 打赏
  • 举报
回复
群集,不懂,顶贴
火才松 2011-09-20
  • 打赏
  • 举报
回复
虚拟机上搭起来试了一下,win2008r2+sql2008r2,没有出现楼主的问题。
只好围观一下。。。
--小F-- 2011-09-20
  • 打赏
  • 举报
回复
失效备援 阙值?
nzperfect 2011-09-20
  • 打赏
  • 举报
回复
经过反复的测试,发现在win2k3 cluster,在禁用public网卡后,总是会自动切换成功,但在win2k8 cluster下,禁用public网卡后,有时成功,大多出现群集资源failed的情况,不能自动切换成功,但通过手工bring online却可以成功。
经与win2k3 cluster对比,发现原因应该是failover的Threshold设置不同,默认情况下,win2k3是10,而win2k8是2.
所以win2k8下,需要将Maximun failures in the specified 由2改为10. 然后再反复禁用网卡,切换成功。
nzperfect 2011-09-20
  • 打赏
  • 举报
回复
[Quote=引用 13 楼 navy887 的回复:]

刚看到一篇文章,不知道说法是否正确,如果正确的话,那确实不能转移。文章如下:

这里要解释一点,理论上的正常情况下,比如节点A突然掉电了,那么这个时候共享存储实际上已经脱离节点A的控制。所以这时候,节点B可以很轻松的将其接管过来。而如果节点A与共享存储之间的链接正常,并且群集服务正在控制共享存储的话,节点B在这种情况下是无法接管过来的。

对于这样的一种机制,我们发现,它跟Win……
[/Quote]

这个说法不一定正确,微软的一线工程师,也就是你开case得到的企业服务支持的工程师,水平也一般,很多问题都是边查case库,边解决。

经过反复的测试并且于win2k3cluster比较,已发现原因。
nzperfect 2011-09-19
  • 打赏
  • 举报
回复
[Quote=引用 16 楼 navy887 的回复:]

引用 15 楼 perfectaction 的回复:
windows 2003的确没遇到过这样的情况。
windows 2008+sql 2008,在网络延时丢包的情况下,的确遇到过不能切换的情况。
下午可能会做一个拔网线的试验。


多谢分享经验!
如果下午做过实验的话,麻烦在这里说一下!多谢!
[/Quote]

刚做了一个禁用外网网卡测试,可以正常切换。不知道你的为何不成?
但拔网线目前不方便做,下午有可能可以试。
navy887 2011-09-19
  • 打赏
  • 举报
回复
[Quote=引用 15 楼 perfectaction 的回复:]
windows 2003的确没遇到过这样的情况。
windows 2008+sql 2008,在网络延时丢包的情况下,的确遇到过不能切换的情况。
下午可能会做一个拔网线的试验。
[/Quote]

多谢分享经验!
如果下午做过实验的话,麻烦在这里说一下!多谢!
nzperfect 2011-09-19
  • 打赏
  • 举报
回复
windows 2003的确没遇到过这样的情况。
windows 2008+sql 2008,在网络延时丢包的情况下,的确遇到过不能切换的情况。
下午可能会做一个拔网线的试验。
xyc880813 2011-09-19
  • 打赏
  • 举报
回复
学习了,感谢楼主分享
navy887 2011-09-19
  • 打赏
  • 举报
回复
刚看到一篇文章,不知道说法是否正确,如果正确的话,那确实不能转移。文章如下:

这里要解释一点,理论上的正常情况下,比如节点A突然掉电了,那么这个时候共享存储实际上已经脱离节点A的控制。所以这时候,节点B可以很轻松的将其接管过来。而如果节点A与共享存储之间的链接正常,并且群集服务正在控制共享存储的话,节点B在这种情况下是无法接管过来的。

对于这样的一种机制,我们发现,它跟Windows 2003的时候是截然相反的。在Win03时代,无论发生何种故障,主节点马上释放共享存储,然后进行仲裁。

咨询了微软官方人士,得到的答复是说,Win03时代的这种机制,会造成群集资源的过度切换,或者叫频繁切换。。所以在Windows 2008里,群集资源的切换,多了一个评估过程,简单说就是只有当一定严重程度的问题发生,或者自身进行一些检测确定它确实无法继续工作时才会促发资源的切换。。
navy887 2011-09-19
  • 打赏
  • 举报
回复
[Quote=引用 11 楼 navy887 的回复:]
禁用网卡也是不可以
[/Quote]

现在怀疑,微软在WIN2008是不是做了改动,如果不是完全故障就不转移。。
navy887 2011-09-19
  • 打赏
  • 举报
回复
禁用网卡也是不可以
nzperfect 2011-09-19
  • 打赏
  • 举报
回复
[Quote=引用 8 楼 navy887 的回复:]
应该是这样的:
我只断了外网的网线
所以主机和存储是通的,和备机也是通的。
只有主机和外网不通
[/Quote]
你再这样测一下,不要拔网线,直接禁用一个server上的外网用的网卡,看会不会切换。
另外,收集一下cluster日志,看看有什么可用信息。
navy887 2011-09-19
  • 打赏
  • 举报
回复
这种情况能不能自动切换。
如果可以的话,我这个会是什么问题?
navy887 2011-09-19
  • 打赏
  • 举报
回复
应该是这样的:
我只断了外网的网线
所以主机和存储是通的,和备机也是通的。
只有主机和外网不通
navy887 2011-09-19
  • 打赏
  • 举报
回复
[Quote=引用 3 楼 perfectaction 的回复:]
你说的断网是指网络在短时间内无法通信吧,比如10s之内连续丢包,并且是心跳线和外网通时断线的情况吧。
[/Quote]

我是直接拔掉主机的外网线
心跳线是两台机器直接连,就是两台机器的心跳应该还是通的,但和外网不通。
Gemini Dean 2011-09-19
  • 打赏
  • 举报
回复
断网后应该会切换的吧
xyc880813 2011-09-19
  • 打赏
  • 举报
回复
没遇到过啊。。。
不过如果断电可以自动切换的话,那么说明见证服务器应该没啥问题,断电之后可以认定claster失效;

但是断网不能自动切换的话,会不会是见证服务器和claster的网络连接还没有断,所以见证服务器认为这个claster还没有失效所以没有切换呢?

总之看看是不是和见证服务器的和这个不切换的claster之前的网络连接有关吧。。
快溜 2011-09-19
  • 打赏
  • 举报
回复
断错网了吧,不能切换说明还能访问到。
加载更多回复(5)

27,580

社区成员

发帖
与我相关
我的任务
社区描述
MS-SQL Server 应用实例
社区管理员
  • 应用实例社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧