奇怪的硬盘问题:MESSAGES报告ERROR可系统正常运行

weixin_38051598 2008-01-14 10:34:22

各位大侠:
这两天遇到一奇怪问题:
硬件:SUN FIRE V250, 4 SCSI HD (73G), ROOT FS 由两块MIRROR成, OS: SOLARIS 9 With SUn Volume Manager
MESSAGES 显示0号硬盘读写错误(only part of them):
Jan  1 11:04:01 sun2 scsi: [ID 107833 kern.warning] WARNING: /pci@1d,700000/scsi@4/sd@0,0 (sd0):
Jan  1 11:04:01 sun2    Error for Command: write(10)               Error Level: Retryable
Jan  1 11:04:01 sun2 scsi: [ID 107833 kern.notice]      Requested Block: 139704496                 Error Block: 139704496
Jan  1 11:04:01 sun2 scsi: [ID 107833 kern.notice]      Vendor: SEAGATE                            Serial Number: 0402B6RQM8
Jan  1 11:04:01 sun2 scsi: [ID 107833 kern.notice]      Sense Key: Unit Attention
Jan  1 11:04:01 sun2 scsi: [ID 107833 kern.notice]      ASC: 0x29 (<vendor unique code 0x29>), ASCQ: 0x3, FRU: 0x4
Jan  1 11:04:01 sun2 scsi: [ID 107833 kern.warning] WARNING: /pci@1d,700000/scsi@4/sd@0,0 (sd0):
Jan  1 11:04:01 sun2    Error for Command: write(10)               Error Level: Informational
Jan  1 11:04:01 sun2 scsi: [ID 107833 kern.notice]      Requested Block: 142820212                 Error Block: 142820212
Jan  1 11:04:01 sun2 scsi: [ID 107833 kern.notice]      Vendor: SEAGATE                            Serial Number: 0402B6RQM8
Jan  1 11:04:01 sun2 scsi: [ID 107833 kern.notice]      Sense Key: Soft Error
Jan  1 11:04:01 sun2 scsi: [ID 107833 kern.notice]      ASC: 0x5d (drive operation marginal, service immediately (failure prediction threshold excee
ded)), ASCQ: 0x0, FRU: 0x5
Jan  1 11:06:41 sun2 scsi: [ID 107833 kern.warning] WARNING: /pci@1d,700000/scsi@4/sd@0,0 (sd0):
Jan  1 11:06:41 sun2    Error for Command: write(10)               Error Level: Retryable
Jan  1 11:06:41 sun2 scsi: [ID 107833 kern.notice]      Requested Block: 142820212                 Error Block: 142820212
Jan  1 11:06:41 sun2 scsi: [ID 107833 kern.notice]      Vendor: SEAGATE                            Serial Number: 0402B6RQM8
Jan  1 11:06:41 sun2 scsi: [ID 107833 kern.notice]      Sense Key: Hardware Error
Jan  1 11:06:41 sun2 scsi: [ID 107833 kern.notice]      ASC: 0x32 (no defect spare location available), ASCQ: 0x0, FRU: 0x4
Jan  1 11:06:42 sun2 scsi: [ID 107833 kern.warning] WARNING: /pci@1d,700000/scsi@4/sd@0,0 (sd0):
Jan  1 11:06:42 sun2    Error for Command: write(10)               Error Level: Retryable
Jan  1 11:06:42 sun2 scsi: [ID 107833 kern.notice]      Requested Block: 142820212                 Error Block: 142820212
Jan  1 11:06:42 sun2 scsi: [ID 107833 kern.notice]      Vendor: SEAGATE                            Serial Number: 0402B6RQM8
Jan  1 11:06:42 sun2 scsi: [ID 107833 kern.notice]      Sense Key: Hardware Error
Jan  1 11:06:42 sun2 scsi: [ID 107833 kern.notice]      ASC: 0x32 (no defect spare location available), ASCQ: 0x0, FRU: 0x4

IOSTAT -EN也显示同样问题. 可是METASTAT 却显示所有分区OK, 并且USER也没记得遇到读写错误. ORACLE数据库运行正常(一部分数据文件在ROOT上). W我试着光驱启动并FSCK硬盘分区,发现有数据坏块(只有一两块), 以及REFERENCE不对等小问题, 并回答"Y"修正这些问题, 然后发现, 修正后的硬盘不能METAREPLACE, 报告一些块读不到. 于是, 拿原来0号盘(本来想换下来的坏盘), 重新与一块新盘做MIRROR, 居然没有任何问题, 而且整个系统完全恢复了.

现在, 我很迷惑:这0号盘究竟是不是真有问题?

先谢了!
...全文
23 3 打赏 收藏 转发到动态 举报
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复

477

社区成员

发帖
与我相关
我的任务
社区描述
其他技术讨论专区
其他 技术论坛(原bbs)
社区管理员
  • 其他技术讨论专区社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧