请专家帮忙分析一下AIX主机自动重启的问题

xuboamei 2011-09-26 11:32:20
今天夜里IBM570 AIX主机自动重启,日志已经抓下,但我不大看得懂,请众高手帮忙分析一哈啊:
最早一个应用程序发生了一个core dump

---------------------------------------------------------------------------
标号:SCAN_ERROR_CHRP
标识:BFE4C025

日期/时间: 公元2011年09月26日 星期一 03时07分53秒
序号: 35897
机器标识: 00C5605C4C00
节点标识: ipossdb
类: H
类型: PERM
资源名: sysplanar0
资源类: planar
资源类型: sysplanar_rspc
位置:

描述
未确定的错误

失败原因
未确定

推荐的操作
运行系统诊断。

详细数据
问题数据

诊断分析
Diagnostic Log sequence number: 5296
Resource tested: sysplanar0
Resource Description: 系统平面
Location:
SRC: 10009137
Description: Power/Cooling subsystem Unrecovered Error, general.
Refer to the system service documentation for more
information.
Additional Words: 2-00000040 3-10000226 4-0000FD37 5-00000000
6-00000000 7-00000000 8-00000000 9-00000000
Possible FRUs:
Priority: M FRU: CBLALL
Location: U7879.001.DQDRCLD

---------------------------------------------------------------------------
标号:SCAN_ERROR_CHRP
标识:BFE4C025

日期/时间: 公元2011年09月26日 星期一 03时06分08秒
序号: 35896
机器标识: 00C5605C4C00
节点标识: ipossdb
类: H
类型: PERM
资源名: sysplanar0
资源类: planar
资源类型: sysplanar_rspc
位置:

描述
未确定的错误

失败原因
未确定

推荐的操作
运行系统诊断。

详细数据
问题数据

诊断分析
Diagnostic Log sequence number: 5294
Resource tested: sysplanar0
Menu Number: 651301
Description:


CEC hardware System resources deconfigured by system due to prior error event.



---------------------------------------------------------------------------
标号:RMCD_INFO_0_ST
标识:A6DF45AA

日期/时间: 公元2011年09月26日 星期一 03时05分51秒
序号: 35895
机器标识: 00C5605C4C00
节点标识: ipossdb
类: O
类型: INFO
资源名: RMCdaemon

描述
启动守护程序。

可能原因
已开始“资源监视和控制”守护程序。

用户原因
已执行 startsrc -s ctrmc 命令或 rmcctrl -s 命令。

推荐的操作
确认是否应启动守护程序。

详细数据
检测模块
RSCT,rmcd.c,1.51,209
错误标识
6eKora0DirTC/rgi/XD1t20...................
参考码

---------------------------------------------------------------------------
标号:SCAN_ERROR_CHRP
标识:BFE4C025

日期/时间: 公元2011年09月26日 星期一 03时05分39秒
序号: 35894
机器标识: 00C5605C4C00
节点标识: ipossdb
类: H
类型: PERM
资源名: sysplanar0
资源类: planar
资源类型: sysplanar_rspc
位置:

描述
未确定的错误

失败原因
未确定

推荐的操作
运行系统诊断。

详细数据
问题数据

诊断分析
Diagnostic Log sequence number: 5291
Resource tested: sysplanar0
Menu Number: 651301
Description:


CEC hardware System resources deconfigured by system due to prior error event.



---------------------------------------------------------------------------
标号:SCAN_ERROR_CHRP
标识:BFE4C025

日期/时间: 公元2011年09月26日 星期一 03时05分09秒
序号: 35893
机器标识: 00C5605C4C00
节点标识: localhost
类: H
类型: PERM
资源名: sysplanar0
资源类: planar
资源类型: sysplanar_rspc
位置:

描述
未确定的错误

失败原因
未确定

推荐的操作
运行系统诊断。

详细数据
问题数据

诊断分析
Diagnostic Log sequence number: 5288
Resource tested: sysplanar0
Resource Description: 系统平面
Location:
SRC: B114F2E7
Description: Processor subsystem including internal cache
Unrecovered Error, general. Refer to the system
service documentation for more information.
Additional Words: 2-030000F0 3-28DA2210 4-C1009090 5-60000000
6-00000000 7-00000026 8-00800196 9-00000000
Possible FRUs:
Priority: M FRU: 80P7080 S/N: YL10C6072018 CCIN: 26F2
Location: U7879.001.DQDKVMH-P2-C1

---------------------------------------------------------------------------
标号:PLAT_DUMP_COMPLETE
标识:51E537B5

日期/时间: 公元2011年09月26日 星期一 03时04分47秒
序号: 35892
机器标识: 00C5605C4C00
节点标识: localhost
类: H
类型: PERM
资源名: sysplanar0
资源类: planar
资源类型: sysplanar_rspc
位置:

描述
保存到文件的 platform_dump

详细数据
platform_dump 指示符事件

诊断分析
Diagnostic Log sequence number: 5284
Resource tested: sysplanar0
Menu Number: 651301
Description:


Platform Firmware Dump Notification.



...全文
1478 6 打赏 收藏 转发到动态 举报
写回复
用AI写文章
6 条回复
切换为时间正序
请发表友善的回复…
发表回复
争取今天 2012-03-07
  • 打赏
  • 举报
回复
标号:SCAN_ERROR_CHRP
标识:BFE4C025

日期/时间: 公元2011年09月26日 星期一 03时07分53秒
序号: 35897
机器标识: 00C5605C4C00
节点标识: ipossdb
类: H #硬件错误类型: PERM
资源名: sysplanar0
资源类: planar
资源类型: sysplanar_rspc
位置:

============================
诊断分析
Diagnostic Log sequence number: 5296
Resource tested: sysplanar0
Resource Description: 系统平面
Location:
SRC: 10009137
Description: Power/Cooling subsystem Unrecovered Error, general.
Refer to the system service documentation for more
information
=================================
综上,很可能是风扇不好用了。当然也可能是其它原因导致风扇不好用
wqc_zj1 2012-03-02
  • 打赏
  • 举报
回复
主板坏拉.更换
ADCC千月 2012-02-24
  • 打赏
  • 举报
回复
你这设备用多久了。
是不是设备微码没升过级,
超过微码使用年限了,
更新下微码就好了。

找提供商更新下微码。

如果不行。可能背板确实坏了。感觉微码可能性大点 。试试去吧。
andycnm 2011-10-28
  • 打赏
  • 举报
回复
看看电源或风扇有没有问题
shenghuiping2001 2011-09-27
  • 打赏
  • 举报
回复
换个内存看看。
xuboamei 2011-09-26
  • 打赏
  • 举报
回复

---------------------------------------------------------------------------
标号:SCAN_ERROR_CHRP
标识:BFE4C025

日期/时间: 公元2011年09月26日 星期一 03时04分39秒
序号: 35891
机器标识: 00C5605C4C00
节点标识: localhost
类: H
类型: PERM
资源名: sysplanar0
资源类: planar
资源类型: sysplanar_rspc
位置:

描述
未确定的错误

失败原因
未确定

推荐的操作
运行系统诊断。

详细数据
问题数据

诊断分析
Diagnostic Log sequence number: 5280
Resource tested: sysplanar0
Resource Description: 系统平面
Location:
SRC: B181850E
Description: Platform Firmware Predictive Error, general. Refer to
the system service documentation for more information.
Additional Words: 2-030000F0 3-28DA0F10 4-D12A3101 5-40000000
6-0000000A 7-00000078 8-00000000 9-00000000
Possible FRUs:
Priority: H Maintainence Procedure: FSPSP04
Location: n/a
Priority: M Maintainence Procedure: FSPSP06
Location: n/a

---------------------------------------------------------------------------
标号:SCAN_ERROR_CHRP
标识:BFE4C025

日期/时间: 公元2011年09月26日 星期一 03时04分08秒
序号: 35889
机器标识: 00C5605C4C00
节点标识: localhost
类: H
类型: PERM
资源名: sysplanar0
资源类: planar
资源类型: sysplanar_rspc
位置:

描述
未确定的错误

失败原因
未确定

推荐的操作
运行系统诊断。

详细数据
问题数据

诊断分析
Diagnostic Log sequence number: 5282
Resource tested: sysplanar0
Resource Description: 系统平面
Location:
SRC: B182E500
Description: Platform Firmware Unrecovered Error, general. Refer to
the system service documentation for more information.
Additional Words: 2-030000F0 3-28DA0110 4-C1D2200D 5-C0000000
6-008118F0 7-00000001 8-01010009 9-00000000
Possible FRUs:
Priority: M Maintainence Procedure: FSPSP16
Location: n/a
Priority: L Maintainence Procedure: FSPSP05
Location: n/a

---------------------------------------------------------------------------
标号:SCAN_ERROR_CHRP
标识:BFE4C025

日期/时间: 公元2011年09月26日 星期一 03时02分23秒
序号: 35888
机器标识: 00C5605C4C00
节点标识: localhost
类: H
类型: PERM
资源名: sysplanar0
资源类: planar
资源类型: sysplanar_rspc
位置:

描述
未确定的错误

失败原因
未确定

推荐的操作
运行系统诊断。

详细数据
问题数据

诊断分析
Diagnostic Log sequence number: 5286
Resource tested: sysplanar0
Resource Description: 系统平面
Location:
SRC: B121E500
Description: Memory subsystem including external cache Unrecovered
Error, bypassed with degraded performance. Refer to
the system service documentation for more information.
Additional Words: 2-030000F0 3-28DA0110 4-C13920FF 5-C1000000
6-00821630 7-00000001 8-00530006 9-00000000
Possible FRUs:
Priority: M FRU: 80P7080 S/N: YL10C6072018 CCIN: 26F2
Location: U7879.001.DQDKVMH-P2-C1

---------------------------------------------------------------------------
标号:FCS_ERR6
标识:D0EAC662

日期/时间: 公元2011年09月26日 星期一 03时02分09秒
序号: 35887
机器标识: 00C5605C4C00
节点标识: localhost
类: H
类型: TEMP
资源名: fcs1
资源类: adapter
资源类型: df1000fa
位置: U7879.001.DQDKVMH-P1-C5-T1
VPD:
Part Number.................03N6441
EC Level....................A
Serial Number...............1B55204673
Manufacturer................001B
Feature Code/Marketing ID...280B
FRU Number.................. 03N6441
Device Specific.(ZM)........3
Network Address.............10000000C9513FA8
ROS Level and ID............0288193D
Device Specific.(Z0)........1001206D
Device Specific.(Z1)........00000000
Device Specific.(Z2)........00000000
Device Specific.(Z3)........03000909
Device Specific.(Z4)........FF801412
Device Specific.(Z5)........0288193D
Device Specific.(Z6)........0683193D
Device Specific.(Z7)........0783193D
Device Specific.(Z8)........20000000C9513FA8
Device Specific.(Z9)........TS1.90X13
Device Specific.(ZA)........T1D1.90X13
Device Specific.(ZB)........T2D1.90X13

描述
微码程序错误

可能原因
适配器微码

失败原因
适配器微码

推荐的操作
若问题持续,则执行下列各项
联系适当的服务代表

详细数据
检测数据
---------------------------------------------------------------------------
标号:PLAT_DUMP_INDICATOR
标识:291D64C3

日期/时间: 公元2011年09月26日 星期一 03时00分54秒
序号: 35886
机器标识: 00C5605C4C00
节点标识: localhost
类: H
类型: INFO
资源名: sysplanar0
资源类: planar
资源类型: sysplanar_rspc
位置:

描述
平台转储数据

详细数据
platform_dump 指示符事件
---------------------------------------------------------------------------
标号:CORE_DUMP
标识:A63BEB70

日期/时间: 公元2011年09月26日 星期一 03时00分54秒
序号: 35885
机器标识: 00C5605C4C00
节点标识: localhost
类: S
类型: PERM
资源名: SYSPROC

描述
软件程序异常终止

可能原因
软件程序

用户原因
用户生成的信号

推荐的操作
校正,然后重试

失败原因
软件程序

推荐的操作
重新运行应用程序
若问题持续,则执行下列各项
联系适当的服务代表

详细数据
信号号码
11
用户进程标识:
119614
文件系统序号
14
INODE 号
263642
处理器标识
12
核心文件名
/export/home/process_wlan/FetchData/core
程序名
bcp
STACK EXECUTION DISABLED
0
附加信息
loc_ErrGe A4
raiseLocM 3C
raiseLocM 3C
ctbcp_get A0
ctbcp_mai 1E0
main 14
__start 94

症状数据
可报告的
1
内部错误
0
症状码
PCSS/SPI2 FLDS/bcp SIG/11 FLDS/loc_ErrGe VALU/a4 FLDS/raiseLocM
---------------------------------------------------------------------------
标号:ERRLOG_ON
标识:9DBCFDEE

日期/时间: 公元2011年09月26日 星期一 03时04分38秒
序号: 35884
机器标识: 00C5605C4C00
节点标识: localhost
类: O
类型: TEMP
资源名: errdemon

描述
记录错误日志打开

可能原因
错误守护程序已自动启动

用户原因
/USR/LIB/ERRDEMON 命令

推荐的操作

1,194

社区成员

发帖
与我相关
我的任务
社区描述
该论坛主要探讨IBM AIX平台的安装、部署、应用开发等话题,并为网友们提供自由交流的平台。
社区管理员
  • IBM AIX社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧