Linux X710/X722 网卡异常记录

背景

公司一ACTA 的板卡, 网卡型号是 X722
板卡按装的操作系统是 CentOS 7.4 (适配有特定的内核驱动, 即使版本很老, 也没换)

一天, 同事请求帮忙看下, 为何网卡无法 up.

状态

使用 ifconfig enp26s0f1 up, 怎么也无法 UP 起来。

ifconfig 的表现始终 没有 running, 收发 全是 0
ethtool 可以看到 连接速率是 10000M, 不是 unknown !
端口的灯是亮着的。

如果光纤没插的话, ethtool 看到的速率是 unknown!

环境

这个板卡的X722 端口, 另外一端连接的是一个 特定网络设备, 不会操作, 就没去看状态。

排查

  1. 重启设备, 故障依旧
  2. 换光模块, 故障依旧
  3. 换光模块, 重启设备,故障依旧
  4. 换思科的堆叠线, OK

排查结果是, 两端的 1310 的光模块不兼容导致。

因为 堆叠线 的两端 EEPROM内的参数是一致的(I2C可以读出光模块内部的参数信息)。

解决

取出两个同批次的光模式, 两端换上, 问题解决。

堆叠线仅限内部测试使用, 部署环境不用堆叠线。(线太长了, 不便整理)

经验

经常能够看到 这种光模块 出 幺蛾子

  1. 光模块 激光衰减严重
  2. 有的设备 光模块 必须配 RX/TX ,否则丢包严重(MRFC/MLFC 导致 802.3 光纤链路层信号不同步等问题)
  3. 光模块 不配对, 3天后发现连接丢失 。。。
  4. 虽然都是万兆通, 但是批次不一样, 兼容性也不一样.