Linux查看TCP重传率及网络优化方法
时间:2026-05-09 19:19:19 268浏览 收藏
在Linux系统中,准确评估TCP重传率绝非简单读取一个计数器,而需严谨计算「重传段数/总发包数」的比值,并通过/proc/net/snmp双采样获取真实增量;sar -n TCP,ETCP可快速监控retrans/s瞬时速率辅助盯盘,ss -ti帮助定位问题连接,最终必须用tcpdump+tshark抓包验证重传真实性——因为重传率只是表象,背后可能隐藏路径丢包、接收端处理瓶颈或应用层异常发包等深层问题,唯有分层排查、交叉验证,才能穿透数字迷雾,精准定位网络病灶。

Linux 查看 TCP 连接重传率,不能只看一个数字——TCPRetransSegs 是累计值,不除以发送总量就毫无意义;真正的重传率必须是「重传段数 / 总发出段数」的比值,且需在固定时间窗口内计算。
用 /proc/net/snmp 提取原始 TCP 重传与发包计数
这是最轻量、最可靠的方式,不依赖 net-tools,容器里也能跑。关键字段都在一行里:
cat /proc/net/snmp | grep -A1 Tcp | tail -n1 输出类似:Tcp: RtoAlgorithm RtoMin RtoMax MaxConn ActiveOpens PassiveOpens AttemptFails EstabResets CurrEstab InSegs OutSegs RetransSegs InErrs OutRsts InCsumErrors
其中第 15 列是 TCPRetransSegs,第 11 列是 TcpOutSegs(注意不是 TcpOutDatagrams)。
- 必须用两次采样:间隔 1–5 秒执行两次
cat /proc/net/snmp,取差值再相除 - 别直接用
netstat -s的 “segments retransmitted” 行——它不带时间戳,无法算率 - 如果
TcpOutSegs增量为 0,但TCPRetransSegs在涨,说明连接已断或应用停发,此时重传率无业务意义
用 sar -n TCP,ETCP 1 看实时重传速率
sar 是唯一能直接输出每秒重传次数(retrans/s)的命令,适合快速盯盘。但它依赖 sysstat 包,且默认不开启历史收集。
- 运行前确认:
systemctl is-active sysstat应为active;否则先sudo systemctl enable --now sysstat - 输出中
retrans/s是瞬时速率,但注意它只统计超时重传(RTO-based),不包含快速重传(3×dupACK) - 若看到
retrans/s > 5持续超过 10 秒,基本可判定路径存在稳定丢包;> 50 则大概率是链路或网卡问题 - 该值和
/proc/net/snmp的增量比对不上是正常的——sar采样逻辑不同,优先信后者做归因
用 ss -ti 定位高重传的具体连接
ss -ti 的 retransmits 字段常被误读:它只在超时重传(RTO timeout)时递增,快速重传、SACK 重传、TLP 都不更新它。
- 正确用法:
watch -n1 'ss -ti state established "( dport = :443 )"' | grep -E "(retransmits|timer)" - 重点观察两件事:一是
retransmits是否非零且增长;二是timer字段是否长期显示on(表示有未确认数据在等 ACK) - 若
retransmits=0但TCPRetransSegs持续上涨,说明重传主力是快速重传,应立刻抓包看 dupACK 模式 - 该值在连接关闭后清零,无法回溯——想留痕得自己轮询写入日志
用 tcpdump + tshark 验证重传真实性
所有内核计数器都可能被绕过或滞后,最终验证必须靠原始报文。Wireshark 的 tcp.analysis.retransmission 过滤器易误判,得人工核序列号。
- 抓包命令务必加
-s 0:tcpdump -i eth0 -s 0 -w retrans.pcap port 80 - 提取重传行:
tshark -r retrans.pcap -Y "tcp.analysis.retransmission" -T fields -e frame.number -e tcp.seq -e tcp.ack -e tcp.len - 关键判断:重传包的
tcp.seq必须等于前一个有效tcp.ack值,否则可能是乱序或 Wireshark 误标 - 如果发现大量重传但
tcp.ack值停滞不动,大概率是接收端丢 ACK,问题不在发端网络而在对端主机或中间设备
重传率本身是个“结果指标”,真正难的是区分它是路径丢包、接收端处理慢、还是应用层发包节奏异常导致的虚假拥塞信号。别只盯着数字,先确认 TCPRetransSegs 和 TcpOutSegs 的采样时机是否严格同步,再决定下一步查链路、查接收端、还是查应用 write() 调用频率。
本篇关于《Linux查看TCP重传率及网络优化方法》的介绍就到此结束啦,但是学无止境,想要了解学习更多关于文章的相关知识,请关注golang学习网公众号!
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
370 收藏
-
294 收藏
-
170 收藏
-
336 收藏
-
268 收藏
-
324 收藏
-
361 收藏
-
143 收藏
-
312 收藏
-
388 收藏
-
351 收藏
-
371 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 485次学习