V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
AkariChan
V2EX  ›  硬件

[求助]Mellanox ConnectX-3 网卡频繁重启无法连接网络(偶现)

  •  
  •   AkariChan · Feb 25, 2024 · 1791 views
    This topic created in 794 days ago, the information mentioned may be changed or developed.

    这几天有线网络突然断了, 由于个人能力原因无法定位分析问题, 想请教下万能的 v 友看看可能是什么情况导致的以及后续如何避免出现这种问题.

    问题表现:

    睡眠唤醒的情况或者开机的情况下有可能出现该问题, 具体表现是 在网络适配器面板中持续事件到达 3~4s 后清零(重启了), 一直反复, 禁用设备/拔网线/换网口/重装驱动 等均无法解决此问题, 重启有一定概率能恢复正常.

    在事件管理器中查看可以看到每次重启都会报以下错误(网络上没有找到 0x40000 的代码):

    Restart Mellanox ConnectX-3 Pro Ethernet Adapter #2 as a result of error that was reported by sensors 0x40000
     Self healing state:
     	Restarts count: 3
    

    PS: 值得一提的是, 本台物理机还有安装有 Ubuntu22.04, 虽然使用频率较低, 但是在该系统下有线连接都是正常的, 感觉不是硬件问题.

    相关配置:

    • 网卡型号 Mellanox CX314A.
    • 驱动版本 MLNX_VPI_WinOF-5_50_53000_All_Win2019_x64.exe
    • Windows 版本 win11 22H2 22621.3155

    连接方式是两张 cx314a 通过光纤直连, 另一块网卡在装有 truenas 系统的的电脑上, nas 通过建立网桥使主机连接到路由器(DHCP)上, 路由器通过 mac 地址分配固定 ip.

    3 replies    2024-12-13 12:24:53 +08:00
    billccn
        1
    billccn  
       Feb 25, 2024
    卡拔下来重插一下看有没有改善?有的时候和主板接触因为外力碰撞会不良。

    还有这种服务器用的卡在普通机箱用的话一定要加强制散热,芯片过热的话会出现各种不稳定。
    AkariChan
        2
    AkariChan  
    OP
       Feb 25, 2024
    @billccn 散热这个确实没注意到, 网卡上没有额外加装风扇. 不过我感觉不是硬件问题, 拔卡重插也试过了, 主要是这台电脑在用 ubuntu 时没有出现过网络问题.
    meishild
        3
    meishild  
       Dec 13, 2024
    @AkariChan 后面找到解决办法了吗?我也遇到了
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5795 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 51ms · UTC 06:06 · PVG 14:06 · LAX 23:06 · JFK 02:06
    ♥ Do have faith in what you're doing.