登录
首页 >  文章 >  linux

Linux查看网卡Ring Buffer解决高并发丢包

时间:2026-05-26 15:22:28 276浏览 收藏

本文深入解析了Linux系统中因网卡Ring Buffer过小导致高并发UDP小包场景下丢包的根本原因与完整排查调优路径:从使用ethtool -g精准查看当前及硬件支持的RX/TX缓冲区大小,到通过/proc/net/dev的fifo列和ethtool -S中的rx_fifo_errors等关键指标交叉验证是否为Ring Buffer溢出所致;再详解ethtool -G安全调大的实操要点(含权限、虚拟化限制、持久化配置),并强调调大后必须同步优化net.core.rmem_max和应用层SO_RCVBUF,否则丢包会转移至协议栈层面;最后指出即使Ring Buffer不再溢出,仍需结合softnet_stat、中断分布与RPS机制排查软中断瓶颈——真正实现从硬件接收、内核处理到应用消费的全链路丢包治理。

Linux系统如何查看网卡的Ring Buffer 解决高并发丢包问题

查当前 Ring Buffer 大小用 ethtool -g

直接运行 ethtool -g eth0(把 eth0 换成你实际的网卡名),输出里会显示:Current hardware settings 下的 RXTX 值,这就是当前 Ring Buffer 的深度。常见默认值是 256 或 512,对高并发 UDP 小包场景明显不够。

注意:ethtool -g 只显示当前设置,不反映是否已达硬件上限;有些网卡(如 ixgbe)最大支持 4096 或 8192,但 igb 可能只到 4096,得查对应驱动文档确认。

常见误操作:ethtool -G eth0 rx 8192 执行失败时,别硬试更大值——先看 ethtool -g eth0 输出里的 Max 行,只允许设在 MinMax 范围内。

确认丢包是否来自 Ring Buffer 溢出

真正要定位问题,不能只看 ifconfignetstat -i 里的 overruns,它只是最终结果。得结合两处统计交叉验证:

  • cat /proc/net/dev 中对应网卡行的 fifo 列:非零说明 Ring Buffer 溢出已发生
  • ethtool -S eth0 | grep -i "rx_fifo\|rx_missed\|rx_no_buffer":重点看 rx_fifo_errors(FIFO 溢出)、rx_missed_errors(DMA 缓冲区满、驱动没及时取走)、rx_no_buffer_count(SKB 分配失败)

如果 rx_fifo_errors 持续上涨,而 UdpOverflows(来自 netstat -s | grep Udp)增长缓慢,基本可断定丢包卡在 Ring Buffer 层,还没进协议栈。

ethtool -G 调大 RX Ring Buffer 的实操要点

调大本身很简单:ethtool -G eth0 rx 4096,但容易忽略几个关键点:

  • 必须用 root 权限执行,普通用户会报 Operation not permitted
  • 部分虚拟化环境(如 virtio_net)不支持动态调整,ethtool -S eth0 可能返回 no stats available,此时需改用 virsh edit 调整 vNIC 配置或换物理网卡
  • 增大后要验证是否生效:ethtool -g eth0 再跑一次,确认 Current 值已更新
  • TX Ring Buffer 对 UDP 接收无影响,一般无需调大;强行设大可能浪费内存,还可能触发某些驱动 bug

临时生效后务必做持久化:写入 /etc/rc.local(Debian/Ubuntu)或添加 POST_UP_CMD="ethtool -G eth0 rx 4096" 到网卡配置文件(RHEL/CentOS),否则重启就回退。

Ring Buffer 调大 ≠ 丢包消失,还得看软中断和 CPU 分布

即使 rx_fifo_errors 归零,/proc/net/softnet_stat 第二列(dropped)还在涨,说明包进了 Ring Buffer,但内核 softirq 没来得及处理,被 softnet 队列丢弃了。

这时候得检查:

  • cat /proc/interrupts | grep eth0:看中断是否全挤在单个 CPU 上
  • cat /proc/net/softnet_stat | awk '{print $2}':持续监控 dropped 计数
  • 启用 RPS:echo f > /sys/class/net/eth0/queues/rx-0/rps_cpusf 是 4 核掩码,按实际 CPU 数调整)

最容易被跳过的是:调大 Ring Buffer 后没同步调大 net.core.rmem_max 和应用层 SO_RCVBUF。网卡“装得下”,内核 socket “接不住”,照样丢包——这阶段的丢包会记在 UdpOverflows 里,不是 rx_fifo_errors

今天关于《Linux查看网卡Ring Buffer解决高并发丢包》的内容就介绍到这里了,是不是学起来一目了然!想要了解更多关于的内容请关注golang学习网公众号!

资料下载
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>