登录
首页 >  文章 >  linux

Linux查看TCP重传率及网络优化方法

时间:2026-05-09 19:19:19 268浏览 收藏

在Linux系统中,准确评估TCP重传率绝非简单读取一个计数器,而需严谨计算「重传段数/总发包数」的比值,并通过/proc/net/snmp双采样获取真实增量;sar -n TCP,ETCP可快速监控retrans/s瞬时速率辅助盯盘,ss -ti帮助定位问题连接,最终必须用tcpdump+tshark抓包验证重传真实性——因为重传率只是表象,背后可能隐藏路径丢包、接收端处理瓶颈或应用层异常发包等深层问题,唯有分层排查、交叉验证,才能穿透数字迷雾,精准定位网络病灶。

Linux怎么查看TCP连接的重传率 Linux网络质量诊断详解

Linux 查看 TCP 连接重传率,不能只看一个数字——TCPRetransSegs 是累计值,不除以发送总量就毫无意义;真正的重传率必须是「重传段数 / 总发出段数」的比值,且需在固定时间窗口内计算。

/proc/net/snmp 提取原始 TCP 重传与发包计数

这是最轻量、最可靠的方式,不依赖 net-tools,容器里也能跑。关键字段都在一行里:

cat /proc/net/snmp | grep -A1 Tcp | tail -n1 输出类似:
Tcp: RtoAlgorithm RtoMin RtoMax MaxConn ActiveOpens PassiveOpens AttemptFails EstabResets CurrEstab InSegs OutSegs RetransSegs InErrs OutRsts InCsumErrors
其中第 15 列是 TCPRetransSegs,第 11 列是 TcpOutSegs(注意不是 TcpOutDatagrams)。

  • 必须用两次采样:间隔 1–5 秒执行两次 cat /proc/net/snmp,取差值再相除
  • 别直接用 netstat -s 的 “segments retransmitted” 行——它不带时间戳,无法算率
  • 如果 TcpOutSegs 增量为 0,但 TCPRetransSegs 在涨,说明连接已断或应用停发,此时重传率无业务意义

sar -n TCP,ETCP 1 看实时重传速率

sar 是唯一能直接输出每秒重传次数(retrans/s)的命令,适合快速盯盘。但它依赖 sysstat 包,且默认不开启历史收集。

  • 运行前确认:systemctl is-active sysstat 应为 active;否则先 sudo systemctl enable --now sysstat
  • 输出中 retrans/s 是瞬时速率,但注意它只统计超时重传(RTO-based),不包含快速重传(3×dupACK)
  • 若看到 retrans/s > 5 持续超过 10 秒,基本可判定路径存在稳定丢包;> 50 则大概率是链路或网卡问题
  • 该值和 /proc/net/snmp 的增量比对不上是正常的——sar 采样逻辑不同,优先信后者做归因

ss -ti 定位高重传的具体连接

ss -tiretransmits 字段常被误读:它只在超时重传(RTO timeout)时递增,快速重传、SACK 重传、TLP 都不更新它。

  • 正确用法:watch -n1 'ss -ti state established "( dport = :443 )"' | grep -E "(retransmits|timer)"
  • 重点观察两件事:一是 retransmits 是否非零且增长;二是 timer 字段是否长期显示 on(表示有未确认数据在等 ACK)
  • retransmits=0TCPRetransSegs 持续上涨,说明重传主力是快速重传,应立刻抓包看 dupACK 模式
  • 该值在连接关闭后清零,无法回溯——想留痕得自己轮询写入日志

tcpdump + tshark 验证重传真实性

所有内核计数器都可能被绕过或滞后,最终验证必须靠原始报文。Wireshark 的 tcp.analysis.retransmission 过滤器易误判,得人工核序列号。

  • 抓包命令务必加 -s 0tcpdump -i eth0 -s 0 -w retrans.pcap port 80
  • 提取重传行:tshark -r retrans.pcap -Y "tcp.analysis.retransmission" -T fields -e frame.number -e tcp.seq -e tcp.ack -e tcp.len
  • 关键判断:重传包的 tcp.seq 必须等于前一个有效 tcp.ack 值,否则可能是乱序或 Wireshark 误标
  • 如果发现大量重传但 tcp.ack 值停滞不动,大概率是接收端丢 ACK,问题不在发端网络而在对端主机或中间设备

重传率本身是个“结果指标”,真正难的是区分它是路径丢包、接收端处理慢、还是应用层发包节奏异常导致的虚假拥塞信号。别只盯着数字,先确认 TCPRetransSegsTcpOutSegs 的采样时机是否严格同步,再决定下一步查链路、查接收端、还是查应用 write() 调用频率。

本篇关于《Linux查看TCP重传率及网络优化方法》的介绍就到此结束啦,但是学无止境,想要了解学习更多关于文章的相关知识,请关注golang学习网公众号!

资料下载
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>