重分求教一个mssql疑难问题,请高手进来看看:

ourmsdn 2008-09-12 09:13:14
MSSQL2000+sp3,双机热备;每台机子各有一个SQL实例,其中一台发生怪问题,每隔一段时间会死机,就是键盘鼠标动不了,但sql server的进程还在运行,也就是说还可以访问库,只是非常慢,只能重启,很纳闷,进程中又没有非常的进程,不懂是什么造成这些情况的,看日志有如下报错,贴出一部份了来,直到重启电脑后才正常
调度程序 0 似乎已被挂起。SPID 0,ECID 0,UMS 上下文 0x05EF0288"
2008-9-11 2:21:06 MSSQLSERVER 信息 (2) 17052 N/A HIS "错误: 17883,严重度: 1,状态: 0
调度程序 3 似乎已被挂起。SPID 0,ECID 0,UMS 上下文 0x05F3E978"
2008-9-11 2:21:06 MSSQLSERVER 信息 (2) 17052 N/A HIS "错误: 17883,严重度: 1,状态: 0
调度程序 2 似乎已被挂起。SPID 0,ECID 0,UMS 上下文 0x05F34EA8"
2008-9-11 2:21:06 MSSQLSERVER 信息 (2) 17052 N/A HIS "错误: 17883,严重度: 1,状态: 0
调度程序 1 似乎已被挂起。SPID 0,ECID 0,UMS 上下文 0x05EC9018"
2008-9-11 2:21:06 MSSQLSERVER 信息 (2) 17052 N/A HIS "错误: 17883,严重度: 1,状态: 0
调度程序 0 似乎已被挂起。SPID 0,ECID 0,UMS 上下文 0x05EF0288"
2008-9-11 2:20:06 MSSQLSERVER 信息 (2) 17052 N/A HIS "错误: 17883,严重度: 1,状态: 0
调度程序 3 似乎已被挂起。SPID 0,ECID 0,UMS 上下文 0x05F3E978"
2008-9-11 2:20:06 MSSQLSERVER 信息 (2) 17052 N/A HIS "错误: 17883,严重度: 1,状态: 0
调度程序 2 似乎已被挂起。SPID 0,ECID 0,UMS 上下文 0x05F34EA8"
2008-9-11 2:20:06 MSSQLSERVER 信息 (2) 17052 N/A HIS "错误: 17883,严重度: 1,状态: 0
调度程序 1 似乎已被挂起。SPID 0,ECID 0,UMS 上下文 0x05EC9018"
2008-9-11 2:20:06 MSSQLSERVER 信息 (2) 17052 N/A HIS "错误: 17883,严重度: 1,状态: 0
调度程序 0 似乎已被挂起。SPID 0,ECID 0,UMS 上下文 0x05EF0288"
2008-9-11 2:19:06 MSSQLSERVER 信息 (2) 17052 N/A HIS "错误: 17883,严重度: 1,状态: 0
调度程序 3 似乎已被挂起。SPID 0,ECID 0,UMS 上下文 0x05F3E978"
2008-9-11 2:19:06 MSSQLSERVER 信息 (2) 17052 N/A HIS "错误: 17883,严重度: 1,状态: 0
调度程序 2 似乎已被挂起。SPID 0,ECID 0,UMS 上下文 0x05F34EA8"
2008-9-11 2:19:06 MSSQLSERVER 信息 (2) 17052 N/A HIS "错误: 17883,严重度: 1,状态: 0
调度程序 1 似乎已被挂起。SPID 0,ECID 0,UMS 上下文 0x05EC9018"
2008-9-11 2:19:06 MSSQLSERVER 信息 (2) 17052 N/A HIS "错误: 17883,严重度: 1,状态: 0
调度程序 0 似乎已被挂起。SPID 0,ECID 0,UMS 上下文 0x05EF0288"
2008-9-11 2:18:06 MSSQLSERVER 信息 (2) 17052 N/A HIS "错误: 17883,严重度: 1,状态: 0
调度程序 3 似乎已被挂起。SPID 0,ECID 0,UMS 上下文 0x05F3E978"
2008-9-11 2:18:06 MSSQLSERVER 信息 (2) 17052 N/A HIS "错误: 17883,严重度: 1,状态: 0
调度程序 2 似乎已被挂起。SPID 0,ECID 0,UMS 上下文 0x05F34EA8"
2008-9-11 2:17:06 MSSQLSERVER 信息 (2) 17052 N/A HIS "错误: 17883,严重度: 1,状态: 0
调度程序 3 似乎已被挂起。SPID 0,ECID 0,UMS 上下文 0x05F3E978"
2008-9-11 2:17:06 MSSQLSERVER 信息 (2) 17052 N/A HIS "错误: 17883,严重度: 1,状态: 0
调度程序 2 似乎已被挂起。SPID 0,ECID 0,UMS 上下文 0x05F34EA8"
2008-9-11 2:16:06 MSSQLSERVER 信息 (2) 17052 N/A HIS "错误: 17883,严重度: 1,状态: 0
调度程序 2 似乎已被挂起。SPID 0,ECID 0,UMS 上下文 0x05F34EA8"
2008-9-11 2:15:53 MSSQLSERVER 错误 (3) 17052 N/A HISSLAVE "[sqsrvres] printODBCError: sqlstate = 08S01; native error = 0; message = [Microsoft][ODBC SQL Server Driver]通讯链接失败
"
2008-9-11 2:15:53 MSSQLSERVER 错误 (3) 17052 N/A HISSLAVE "[sqsrvres] CheckQueryProcessorAlive: sqlexecdirect failed
"
2008-9-11 2:15:53 MSSQLSERVER 错误 (3) 17052 N/A HISSLAVE "[sqsrvres] printODBCError: sqlstate = 08S01; native error = 0; message = [Microsoft][ODBC SQL Server Driver]通讯链接失败
"
2008-9-11 2:15:53 MSSQLSERVER 错误 (3) 17052 N/A HISSLAVE "[sqsrvres] CheckQueryProcessorAlive: sqlexecdirect failed
"
2008-9-11 2:15:53 MSSQLSERVER 错误 (3) 17052 N/A HISSLAVE "[sqsrvres] printODBCError: sqlstate = 08S01; native error = 0; message = [Microsoft][ODBC SQL Server Driver]通讯链接失败
"
2008-9-11 2:15:53 MSSQLSERVER 错误 (3) 17052 N/A HISSLAVE "[sqsrvres] CheckQueryProcessorAlive: sqlexecdirect failed
"
2008-9-11 2:15:53 MSSQLSERVER 错误 (3) 17052 N/A HISSLAVE "[sqsrvres] printODBCError: sqlstate = 08S01; native error = 0; message = [Microsoft][ODBC SQL Server Driver]通讯链接失败
"
2008-9-11 2:15:53 MSSQLSERVER 错误 (3) 17052 N/A HISSLAVE "[sqsrvres] CheckQueryProcessorAlive: sqlexecdirect failed
"
2008-9-11 2:15:53 MSSQLSERVER 错误 (3) 17052 N/A HISSLAVE "[sqsrvres] printODBCError: sqlstate = 08S01; native error = 0; message = [Microsoft][ODBC SQL Server Driver]通讯链接失败
"
2008-9-11 2:15:53 MSSQLSERVER 错误 (3) 17052 N/A HISSLAVE "[sqsrvres] CheckQueryProcessorAlive: sqlexecdirect failed
"
2008-9-11 2:15:53 MSSQLSERVER 错误 (3) 17052 N/A HISSLAVE "[sqsrvres] OnlineThread: QP is not online.
"
2008-9-11 2:15:53 MSSQLSERVER 错误 (3) 17052 N/A HISSLAVE "[sqsrvres] printODBCError: sqlstate = HY018; native error = b; message = [Microsoft][ODBC SQL Server Driver][TCP/IP Sockets]一般性网络错误。请检查网络文档。
"
2008-9-11 2:15:53 MSSQLSERVER 错误 (3) 17052 N/A HISSLAVE "[sqsrvres] printODBCError: sqlstate = 01000; native error = 2746; message = [Microsoft][ODBC SQL Server Driver][TCP/IP Sockets]ConnectionWrite (send()).
"
2008-9-11 2:15:53 MSSQLSERVER 错误 (3) 17052 N/A HISSLAVE "[sqsrvres] CheckQueryProcessorAlive: sqlexecdirect failed
...全文
294 10 打赏 收藏 转发到动态 举报
写回复
用AI写文章
10 条回复
切换为时间正序
请发表友善的回复…
发表回复
ourmsdn 2008-12-23
  • 打赏
  • 举报
回复
UP
我原来也是,后来升级到SP4后,问题也依然存在,不过提示错误有点不一样了,不懂为什么,不过SQL 的日志有说是:
spid1 SQL Serverhas encountered 192
occurrence(s) of IO requests taking longer than 15 seconds to complete
on file [E:\SEDATA\stressdb5.ndf] in database [stressdb] (7). The OS
file handle is 0x00000000000074D4. The offset of the latest long IO is:
x00000000022000".

但报这个错的时间并不是死机时间,只能说那时间很忙,过了几个小时候就死了,因为是晚上,没有看到它是怎么死的,就是一下子系统日志报类似:MSSQLSERVER 错误 (3) 17052 N/A HISSLAVE "[sqsrvres] printODBCError: sqlstate = 08S01; native error = 0; message = [Microsoft][ODBC SQL Server Driver]通讯链接失败
然后程序就不能用了,只有手动重启服务器了
accpyy 2008-12-23
  • 打赏
  • 举报
回复
学习中 帮顶一下
dawugui 2008-09-12
  • 打赏
  • 举报
回复
给个帖,自己看看.

双机热备份安装文档
(Ver 1.1 2002.11.26)
下面的文档以IBM Netfinity 7600/xSeries 250为例!
说明如何安装SQL 群集
本方案我已经在4家医院使用,是本人在总结了多次经验教训后写出来的

1. 从IBM下载,具体的地址参阅IBM手册。Server Raid Firmware软件,升级BIOS,具体升级方法参考IBM升级文档
2. 制作驱动程序
在其它的机器中,插入Server Guide x.x.x System Upates And Applications光盘,next->next->选择IBM Netfinity 7600/xSeries 250 System Diskettes ->next->选择Advanced System Management Device Driver Dsikette 和IBM ActivePCI Software for Microsoft windows 2000->Next->Next->插入空的软盘,系统开始自动制作驱动程序盘,共2张。
插入ServerRaid x.xx Support CD,将光盘中Diskettes/tools/disk4w32.exe和Images/dd.img 文件拷贝到硬盘中,然后运行 dsk4w32 dd.img a: 将文件释放到一张新的软盘中。
3. 在nt1,nt2上安装win2000 , 切记必须去掉IIS,和群集服务
设置IP地址
NT1:网卡1:IP 192.168.0.2,mask:255.255.255.0,Dns1:192.168.0.2,Dns2:192.168.0.3
网卡2: IP 10.0.1.1 ,mask: 255.0.0.0, Dns1:10.0.1.1,Dns2:10.0.1.2
Nt2:网卡1:IP 192.168.0.3,mask:255.255.255.0,Dns1:192.168.0.3,Dns2:192.168.0.2
网卡2:IP 10.0.1.2 mask:255.0.0.0 Dns1:10.0.1.2,Dns2:10.0.1.1
安装后需要安装必要的驱动程序
右击我得电脑->属性->硬件->设备管理器->可以看到2个未知的设备,先卸栽第一个未知设备,然后右击计算机名,选择扫描硬件驱动,插入制作好的Advanced System Managerment软盘,安装驱动
然后卸栽第二个未知设备,同样的方法扫描驱动,然后插入Active PCI Device软盘
安装后,必须重新启动计算机
最后卸栽第三个未知设备,同样地方法扫描驱动,然后插入 ServeRaid 驱动软盘或光盘
注意:如果硬盘上有东西,必须将所有的分区全部删除,然后必须重新启动!!!
4. 重新启动 NT2 并放入SeveRaid 光盘
系统会首先升级Bios 和 Firmware ,升级后重新启动,然后自动进入ServeRaid Manager
在controller1,在Arrays 右击选择Create Arrays->Express Configuration for controller1->Next->选择Raid level 为1,(不要使用1E或5) 具体的选择和磁盘的数量有关,注意不可以选择Raid Levl 5,一般2个为1,多于2个用1+0,以4个为例,首先将2个磁盘设为1个组,做成Raid0,然后再将另外两个磁盘设为1个组,也做成Raid0,最后将这个磁盘做成Raid1
重新启动后
右击Controller1->选择Clustering Actions-Configure for Clustering,改Controller name=Node2,Partnet name=Node1,channel1=6

右击controller1->选change strip-unit size 为16KB->选择YES
单击窗口右上方的差号,选择Reboot
重新启动后,取出光盘,关闭NT2

3. 打开NT1,插入ServeRaid 光盘
注意此时系统会出现很多的信息,不能自动启动,这是因为磁盘阵列的控制权在Nt2上,按F5,系统自动更新Raid卡的BIOS,然后进入ServeRaid Manager

右击controller1选择Restore to factory default Settings,在Arrays 右击选择Create Arrays->Express Configuration for controller1->Next->选择Raid level 为1,具体的选择和磁盘的数量有关,

重新启动后
右击Controller1->选择Clustering Actions-Configure for Clustering,改Controller name=Node1,Partnet name=Node2, channel1=7

右击controller1->选change strip-unit size 为16KB->选择YES
单击窗口右上方的差号,选择Reboot
重新启动后,取出光盘

4. 安装最新的ServicePack,你必须安装最新的更新软件,以防止病毒的发生
5. 修改目录方式
Nt1
开始->程序->管理工具->配置服务器->Active Directory->向下移动点击启动->选新域的域控制器->创建一个新的域目录树,创建新的域目录林继续安装->Dns全名为医院的简写,如ZZX ->是->域的NetBios名为ZZX->以下的操作全部选择默认
安装后,系统必须重新启动
在NT1启动后
重新启动NT2
开始->程序->管理工具->配置服务器->Active Directory->向下移动点击启动->选择现有域的额外域控制器->输入用户名administrator和密码没有,域名填写Nt1的域名如ZZX->Next ->单击浏览选择ZZX,下一步->其它的操作全部按照默认设置
重新启动计算机

6. 安装ServeRaid管理程序
首先安装NT1
放入ServeRaid光盘,按照向导安装ServeRaid Manager程序,安装后,将光盘中programs\winnt\cluster目录中的所有文件,拷贝到 C:\cluster目录中,备用
Nt2
放入ServeRaid光盘,按照向导安装ServeRaid Manager程序,安装后,将光盘中programs\winnt\cluster目录中的所有文件,拷贝到 C:\cluster目录中,备用


7. 打开NT1,插入ServeRaid 光盘
注意此时系统会出现很多的信息,不能自动启动,这是因为磁盘阵列的控制权在Nt2上,按F5,系统自动更新Raid卡的BIOS,然后进入ServeRaid Manage
右击Controller1->选择Clustering Actions-Configure for Clustering,
merge group information中logical drive1为shared, Merge group=1,点击OK
重新启动计算机

8. 安装磁盘阵列,写入签名
首先在NT1上
右击我的电脑->管理->磁盘管理,计算机会自动显示,将签名写入磁盘1->当出现选择要升级的磁盘时,将磁盘1前的勾去掉->下一步->完成
这是,磁盘1已经作为基本磁盘出现,绝对不能作为动态磁盘出现,如果是需要转换为基本磁盘
右击磁盘1,选择创建分区->下一步->主磁盘分区->下一步->下一步->选择指定驱动器号为S: ,格式化为NTFS分区->完成
关闭我的电脑
然后将S:的卷标改为share
在Nt2上写入签名
在NT2上运行c:\cluster\support\Ipshahto.exe,右击我的电脑选择管理->磁盘管理,可以看到基本磁盘share盘,并且盘符为E:,单击磁盘E: 右击选择更改驱动器名和路径,指派驱动器号为S:,确定即可
关闭我的电脑
11. 创建群集管理员帐户
该帐户建立方法是:开始->程序->管理工具->Active Directory 用户计算机->点击users,,右击选择新建-用户,用户登录名为clusterAdmin,姓cluster,名为admin,下一步->输入密码->选择密码永不过期,用户不能更改密码->完成
然后选择刚刚建立的clusterAdmin,右击选择属性->在描述中输入,一些警告信息->单击成员属于,添加所有的组->应用,确定即可
12. 安装群集软件
首先安装Nt1
在Nt1上,运行c:\cluster\support\ipshahto.exe
等待几分钟
然后插入2000光盘,在添加和删除组件中,选择群集服务,系统开始安装群集软件,系统拷贝数据后,当系统询问是否继续安装的时候,点击取消。

然后运行 c:\cluster\setup.exe
当出现添加或删除 windows 2000组件时,选择群集服务->按照向导安装->单击我理解->下一步->然后选择群集中的第一个节点->群集的名称为Nt,如果原服务器的名为Nt,请改为其它的名称->下一步->输入群集服务使用的域帐户为clusteradmin,密码->下一步->当计算机出现网络连接时

按下面配置
3com 网卡(另外添加的100M网卡),选择只用于混合群集通讯,IBM网卡选择只用于群集通讯,选择是,在群集IP地址中IP输入虚拟服务器server的IP地址为192.168.0.4,子网:255.255.255.0
网络为本地连接,就是IBM网卡使用的连接,完成,按向导操作

当出现IBM ServeRaid Cluster Configuration wizard->下一步->选择IPSHA DISK S:->下一步->完成->finish

安装NT2

插入2000光盘,在添加和删除组件中,选择群集服务,系统开始安装群集软件,系统拷贝数据后,当系统询问是否继续安装的时候,点击取消。

在Nt2中运行c:\cluster\setup.exe ->选择群集服务->下一步->下一步->硬件配置窗口中,选择第二个或下一个节点->下一步->在创建或加入群集中选群集中,选择用下面帐户连接到群集,用户名为clusteradmin ,输入密码->下一步->确定,输入密码->下一步->完成->确定->系统重新出现IBM SeveRaid Cluster Configuration Wizard->下一步->完成->Finish

13. 在Nt2上 ,安装Dns服务
在添加和删除程序中,选择DNS服务,安装

至此,群集服务已经安装完毕
测试方法
两台机器:开始->程序->管理工具->群集管理器
组-单击 IP SHA GROUP,在右边的列表中查看 IPSHA DISK S: 的所有着是NT1还是NT2,应该为Nt1
直接关闭NT1,等几分钟,看一下,IP SHA DISK S:的资源是否自动变为NT2

同时在站机中
开始->运行-> ping server –t 可以看到开始值 192.168.1.4 有响应,在关闭Nt1计算机后,出现无响应,然后重新有响应

恭喜:群集已经安装成功了,如果不能自动切换,所有的步骤都必须重新来过!更新 BIOS除外。

14. 备份设置
重新开启Nt1
右击我的电脑->管理->磁盘管理器->创建将磁盘0的其它部分做成一个扩展分区,然后创建2个分区,一个2048M的Fat32分区,盘符为F: 其它全部作为一个NTFS分区
在Nt2上做同样的操作

然后用软盘启动NT1和NT2
用ghost备份分区的内容到 F: 盘中。
14.安装SQL 2000 企业版
放入光盘->选择安装服务器->选择虚拟服务器,名称为NT,或原服务器的名称,输入序列号,在故障转移集群中输入虚拟IP地址192.168.0.1,子网255.255.255.0,在出现请选择用来防治数据文件的群集磁盘中选择IPSHA DISK S:下的S:,系统会出现警告,选择是->下一步,输入群集管理员的用户名(clusteradmin)和密码,用户名,域->下一步->安装类型选择典型->下一步->在服务帐户中,选择对每个服务使用同一帐户,在服务设置中,用户名为clusteradmin ,输入密码,选择身份验证模式中选混合模式,根据需要输入Sa 的密码
注意:必须严格按照步骤进行,一步也不能错,否则只有重新安装!
zjcxc 元老 2008-09-12
  • 打赏
  • 举报
回复
你用什么方式做双机热备份的?
zoroz 2008-09-12
  • 打赏
  • 举报
回复
qinhl99 2008-09-12
  • 打赏
  • 举报
回复
xuexi!
fangsp 2008-09-12
  • 打赏
  • 举报
回复
帮你顶一个吧
hero_girl 2008-09-12
  • 打赏
  • 举报
回复
顶,学习,没用到过
utpcb 2008-09-12
  • 打赏
  • 举报
回复
看看
ourmsdn 2008-09-12
  • 打赏
  • 举报
回复
这和阵列没关系吧,我是其中一台机子出那问题,另一台正常

34,590

社区成员

发帖
与我相关
我的任务
社区描述
MS-SQL Server相关内容讨论专区
社区管理员
  • 基础类社区
  • 二月十六
  • 卖水果的net
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧