Pcie挂多功能设备出现的一个问题

flypig8900 2012-05-17 10:15:39
现在做的一个案子出现一个很棘手的问题,本人经验不足,还望版主不吝赐教。
在pcie switch下挂了一个FC和sas硬盘,当pcie设置为gen1时,不会有问题。
设置为gen2,pcie 会报错,有data link error的错误,接着cpu也死掉,打印如下
# irq 128: nobody cared (try booting with the "irqpoll" option)
Call Trace:
[<ffffffff80112f7c>] dump_stack+0x8/0x34
[<ffffffff8034402c>] __report_bad_irq+0x3c/0xd8
[<ffffffff8034424c>] note_interrupt+0x184/0x250
[<ffffffff80344f40>] handle_level_irq+0x138/0x170
[<ffffffff802e2164>] do_IRQ+0x2c/0x40
[<ffffffff80118d88>] plat_irq_dispatch+0x70/0xb8
[<ffffffff80100988>] ret_from_irq+0x0/0x4
[<ffffffff80342588>] handle_IRQ_event+0x40/0x190
[<ffffffff80344eb4>] handle_level_irq+0xac/0x170
[<ffffffff802e2164>] do_IRQ+0x2c/0x40
[<ffffffff80118d88>] plat_irq_dispatch+0x70/0xb8
[<ffffffff80100988>] ret_from_irq+0x0/0x4
[<ffffffff80311f04>] __do_softirq+0x7c/0x1a0
[<ffffffff80312098>] do_softirq+0x70/0x78
[<ffffffff80118d68>] plat_irq_dispatch+0x50/0xb8
[<ffffffff80100988>] ret_from_irq+0x0/0x4
[<ffffffffc00a6878>] sgv_pool_alloc+0x1f8/0xde0 [scst]
[<ffffffffc0088cbc>] scst_alloc_space+0xfc/0x300 [scst]
[<ffffffffc006e0c8>] scst_prepare_space+0x238/0x7e0 [scst]
[<ffffffffc00760e8>] scst_process_active_cmd+0x7b8/0xbb8 [scst]
[<ffffffffc00765d4>] scst_do_job_active+0xec/0x228 [scst]
[<ffffffffc0076ab0>] scst_cmd_thread+0x258/0x5f8 [scst]
[<ffffffff803255a0>] kthread+0x88/0x90
[<ffffffff802e2ca8>] kernel_thread_helper+0x10/0x18
handlers:
[<ffffffffc01328a8>] (_base_interrupt+0x0/0x4f8 [mpt2sas])
Disabling IRQ #128
ERROR PEMX_INT_SUM(0)[SE]: System Error, RC Mode Only.
(cfg_sys_err_rc)
ERROR PEMX_DBG_INFO(0)[RTLPLLE]: Received TLP has link layer error
pedc_radm_trgt1_dllp_abort & pedc__radm_trgt1_eot
ERROR PEMX_DBG_INFO(0)[RCEMRC]: Received Correctable Error Message (RC Mode
only)
pedc_radm_correctable_err
ERROR PEMX_DBG_INFO(0)[ACTO]: A Completion Timeout Occured
pedc_radm_cpl_timeout
ERROR PEMX_DBG_INFO(0)[RACUR]: Received a completion with UR status
radm_rcvd_cpl_ur
Data bus error, epc == ffffffffc0168350, ra == ffffffffc01a1424
Data bus error, epc == ffffffffc0168350, ra == ffffffffc01a1424
Oops[#1]:
现怀疑是链路上信号质量的问题,但是也不应该会导致cpu死掉吧?不知该如何下手分析
...全文
617 3 打赏 收藏 转发到动态 举报
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
flypig8900 2012-09-25
  • 打赏
  • 举报
回复
找到最终原因,MRRS不匹配,光模块驱动中的readrq修改和处理芯片设置相一致,死机问题没再出现,link error 的错误由于链路信号质量不好才出现。

taoshahai 2012-05-20
  • 打赏
  • 举报
回复
我这边有类似的问题,我的设备是1X的,我插到2X上了,
woshi_ziyu 2012-05-17
  • 打赏
  • 举报
回复
没做过

RC Mode Only是什么意思啊
M/D-CAP3U是天津雷航光电科技有限公司推出的一款复合加速计算平台,由Xilinx的28nm制程的FPGA — XC7K325T-3FFG900I和NVidia的16nm制程的GPU — TX2互联构成。 产品细节 FPGA的前端接口 支持CameraLink Base输入1路 支持SD-SDI / HD-SDI / 3G-SDI输入1路 支持同轴高清STP视频输入1路 支持D1标清模拟视频输入4路 支持CameraLink Base输出1路 支持DVI / HDMI输出1路 支持同轴高清STP视频输出1路 TX2 GPU扩展出的接口 10 / 100 / 1000三速自适应以太网 HDMI输出(micro-HDMI连接器) USB3.0 / USB2.0输出 系统存储接口 支持SATA硬盘(mSATA连接器) 支持NVME-SSD硬盘(M.2 M Key连接器) FPGA性能指标及功能描述 板载1GByte DDR3-1600内存(FPGA接的DDR3) 强大的Kintex-7 FPGA专注于浮点高密运算 / 算法预处理 / 算法加速 / 前端接口管理等功能 TX2-FPGA的PCIE带宽是800MB/s ~ 1.2GB/s 存储及使用环境 存储温度 :-55℃~125℃ 工作温度 :-45℃~80℃ 工作时相对湿度 :20%~80% 震动冲击 :±35g 可靠性 :MTBF ≥ 5000h 维修性 :MTTR ≤ 0.5h 供电电压 :+ 12V 整机功耗 :≤ 30W 尺寸 :100*160MM 提供的软件 FPGA固件 PCIE信道管理及收发引擎,视频前端收发引擎,NVME读写引擎 TX2侧的Linux驱动 负责将各个视频输入输出节点映射为Linux系统下标准的V4L2设备,所有的视频数据都是经由PCIE链路由FPGA推送至TX2的DDR4内存,后FPGA中断通知TX2取视频数据 TX2侧的V4L2视频捕获Demo 演示如何通过V4L2驱动抓取前端视频 经典的算法Demo 在线学习型目标跟踪(可提供源码,作为您的开发起点) 前沿的算法Demo Yolo—基于深度学习的多目标识别框架(可提供源码,作为您的开发起点)

21,597

社区成员

发帖
与我相关
我的任务
社区描述
硬件/嵌入开发 驱动开发/核心开发
社区管理员
  • 驱动开发/核心开发社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧