lsof-L1查看deletedsocket泄漏方法
时间:2026-03-06 09:55:34 434浏览 收藏
本文详解了如何利用 `lsof +L1` 发现并精准定位 Unix domain socket(UDS)资源泄漏——当大量 socket 显示为 `(deleted)` 时,往往意味着路径已被 `unlink()` 但文件描述符未关闭,形成隐蔽的长期驻留泄漏;文章强调不能仅依赖单次 `lsof` 输出,而需结合 `watch` 观察增长趋势、用 `ss -x -p` 关联 inode 与进程、深入 `/proc/pid/fd/` 反查 FD 源头,并特别提醒抽象命名空间 socket(`@` 开头)因不依赖文件系统、`unlink` 无效,其泄漏更难被 `+L1` 捕获,必须通过 `ss` 基线比对或 eBPF 追踪 `sys_socket`/`sys_close` 才能彻底揪出那些藏在初始化逻辑、错误分支或 fork 子进程继承中的 close 遗漏。

为什么 lsof +L1 会显示大量 deleted 的 Unix domain socket
Unix domain socket(UDS)被 unlink() 后,若仍有进程持有其文件描述符,内核不会立即释放 socket 结构体,而是标记为 (deleted) —— 这不是 bug,是正常语义:路径已删,但资源尚被引用。但若长期堆积(比如成百上千),说明有 socket 创建后未正确关闭,或 close() 被遗漏,属于典型的资源泄漏。
关键点:lsof +L1 只显示“链接数为 0 且路径已删除”的文件(含 UDS),但它不区分“刚删、正待回收”和“泄漏驻留”。需结合进程生命周期、FD 生命周期进一步判断。
如何确认是泄漏而非瞬时状态
单次 lsof +L1 | grep unix 输出不可靠。要验证是否泄漏,得看它是否随时间增长、是否绑定到长期运行的进程(如 daemon)、以及 FD 是否持续不释放。
- 用
watch -n 5 'lsof +L1 | grep unix | wc -l'观察 1–2 分钟内数量是否稳定上升 - 检查对应进程是否本该短命却常驻:比如一个 worker 进程 fork 后未清理父进程创建的 UDS FD
- 注意
lsof输出中TYPE列为unix、NAME列含@(抽象命名空间)或实际路径(如/tmp/mysock)且标有(deleted) - 抽象 socket(
@/tmp/xxx)即使路径不存在也可持续存在,lsof +L1同样捕获——别误以为只有文件系统路径才可能泄漏
定位泄漏源头的实操步骤
核心思路:从 FD 反查代码逻辑,而非仅依赖 lsof。Linux 提供足够线索,但需组合使用。
- 拿到泄漏 socket 的 PID 和 FD 编号(
lsof +L1输出中PID和FD列,如1234 12u) - 进入
/proc/1234/fd/12,执行readlink .确认类型(输出类似socket:[12345678]) - 用
ss -x -t -n -p | grep 12345678查该 inode 对应的 socket 状态(-x表示 Unix socket;-p需 root 权限才能看到进程名) - 若进程是自己维护的,检查代码中:
- 是否每次
socket(AF_UNIX, ...)都配对close()?尤其在错误分支、异常跳转、子进程继承场景下 - 是否调用
unlink()后忘记close()?常见于服务启动时清理旧 sock 文件,但残留 FD - 是否用
fork()后未在子进程close()父进程传入的 UDS FD?导致子进程退出后 FD 仍被父进程持有
- 是否每次
避免抽象 socket 泄漏的特殊注意事项
抽象命名空间 socket(路径以 @ 开头,如 @/tmp/agent)不占文件系统 inode,unlink() 无效,只能靠 close() 释放。很多 C 库封装(如 libdbus、glib)会自动管理,但裸写 bind() + listen() 时极易出错。
- 抽象名本质是内存地址前缀,
bind(sock, (struct sockaddr*)&addr, offsetof(struct sockaddr_un, sun_path) + len)中len必须包含@字符本身(即sun_path[0] = '\0',后续内容才算抽象名) - 若 bind 成功但后续未 close,该 socket 会一直存活,且
lsof +L1不显示它(因为没调用 unlink,无 deleted 状态)——所以+L1漏掉的抽象 socket 泄漏更隐蔽,得靠ss -x | wc -l对比基线值 - Go、Python 等语言 runtime 通常封装了 UDS 生命周期,但若用
syscall或ctypes直接调用,同样要手动 close
真正难排查的不是 “有没有泄漏”,而是 “哪个路径创建后没 close” —— 尤其当 socket 在初始化阶段创建、却被整个生命周期复用时,日志和堆栈都难以覆盖。建议在关键路径加 setsockopt(..., SO_PASSCRED, ...) 日志,或用 bpftrace hook sys_socket 和 sys_close 做 FD 生命周期追踪。
今天关于《lsof-L1查看deletedsocket泄漏方法》的内容就介绍到这里了,是不是学起来一目了然!想要了解更多关于的内容请关注golang学习网公众号!
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
282 收藏
-
243 收藏
-
429 收藏
-
393 收藏
-
365 收藏
-
206 收藏
-
226 收藏
-
345 收藏
-
410 收藏
-
319 收藏
-
291 收藏
-
125 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 485次学习