登录
推荐 文章 Go 技术 课程 下载 专题 AI
首页 >  文章 >  linux

Linux inode 用满怎么办:从 df -i 到小文件清理的完整实验

来源:17golang原创

时间:2026-07-01 14:43:10 399浏览 收藏

Linux 服务器报“磁盘已满”时,`df -h` 可能还显示剩余空间不少,真正用完的是 inode。inode 可以理解为文件元数据名额,小文件数量太多时,即使磁盘容量还够,也会出现无法创建文件、日志写不进去、临时文件失败、服务启动异常等问题。本文用一个实验把排查路径跑一遍:先看 `df -i`,再定位小文件目录,最后清理并验证恢复。

目录
  • 前置条件:先理解 inode 和磁盘空间的区别
  • 初始化实验:制造一个小文件目录
  • 运行检查:df -h 正常但 df -i 告警
  • 定位目录:找出文件数量异常的位置
  • 安全清理:先确认再删除
  • 扩展实验:给业务目录加防线
  • 清理和总结

前置条件:先理解 inode 和磁盘空间的区别

磁盘容量表示还能存多少字节,inode 表示还能创建多少个文件。一个 1KB 的小文件和一个 1GB 的大文件,都会占用 inode。日志切片、缓存碎片、邮件队列、会话文件、临时上传目录、爬虫结果目录,都可能在短时间内制造大量小文件。

判断这类问题不能只看 `df -h`,还要看 `df -i`:

df -h
df -i

如果容量使用率不高,但 inode 使用率接近 100%,就说明问题方向不是“大文件占满磁盘”,而是“小文件数量打满 inode”。

初始化实验:制造一个小文件目录

下面用一个临时目录模拟小文件堆积。生产环境不要直接照搬制造文件的命令,这里只是为了让现象更直观。

mkdir -p /tmp/inode-lab/cache
for n in $(seq 1 30000); do
  printf 'x' > "/tmp/inode-lab/cache/item-$n.tmp"
done

find /tmp/inode-lab/cache -type f | wc -l

如果你在测试机上观察,`df -i /tmp` 的 inode 使用数会增加。真实线上通常不是 3 万个文件这么温和,而是几十万、几百万个碎文件持续堆积。

运行检查:df -h 正常但 df -i 告警

Linux inode 用满现象:df -h 还有空间但 df -i 显示 IUse 100%

排查时先看两个命令输出:

df -h /
df -i /

典型现象可能是这样的:

Filesystem      Size  Used Avail Use% Mounted on
/dev/vda1        40G   25G   13G  66% /

Filesystem      Inodes  IUsed IFree IUse% Mounted on
/dev/vda1       2621440 2621440     0  100% /

第一段输出会让人误以为磁盘还有 13G;第二段才指出 inode 已经没有空余。此时继续写日志、创建 session 文件、落临时文件,都可能失败。

定位目录:找出文件数量异常的位置

定位时不要一上来删除,先按目录层级统计文件数量。可以从可疑目录开始,比如 `/var/log`、`/tmp`、业务缓存目录、上传临时目录、队列目录。

sudo find /var -xdev -type f | awk -F/ '{print "/"$2"/"$3}' | sort | uniq -c | sort -nr | head
sudo find /tmp -xdev -type f | wc -l
sudo find /var/spool -xdev -type f | wc -l

如果某个目录文件数异常高,再进入下一层细分:

sudo find /var/spool/app -xdev -type f | awk -F/ '{print "/"$2"/"$3"/"$4}' | sort | uniq -c | sort -nr | head

Linux 小文件目录扫描和恢复验证:目录扫描、文件数量、安全清理、恢复验证

`-xdev` 的作用是限制在当前文件系统内,避免跨到挂载盘后统计结果混乱。线上机器目录多时,建议先在业务低峰做统计,避免对磁盘产生额外压力。

安全清理:先确认再删除

清理小文件最怕误删业务数据。建议分三步走:

  1. 先确认来源:确认目录属于缓存、临时文件、旧日志、可重建数据,而不是用户上传原件或业务账务文件。
  2. 先抽样查看:看文件名、时间、大小、所属进程,确认是否还在被使用。
  3. 再按条件清理:按时间、后缀、目录白名单清理,不用宽泛路径一把删。
sudo find /tmp/inode-lab/cache -type f -mtime +7 | head
sudo find /tmp/inode-lab/cache -type f -mtime +7 -print0 | sudo xargs -0 rm -f

df -i /tmp
find /tmp/inode-lab/cache -type f | wc -l

如果是业务日志目录,优先检查 logrotate 或应用自身日志切分配置;如果是缓存目录,优先补 TTL、最大条目数和定期清理任务。一次手工删除只能止血,不能防止复发。

扩展实验:给业务目录加防线

防止 inode 再次用满,可以从业务和运维两侧加限制:

  • 缓存目录:设置最大数量、过期时间和后台清理,避免无限增长。
  • 日志目录:配置按大小和时间切分,同时限制保留天数。
  • 上传目录:失败上传和临时切片要有过期清理。
  • 监控告警:把 `df -i` 纳入告警,inode 使用率 80% 提醒、90% 告警。
  • 部署检查:新服务上线前确认临时目录、缓存目录、队列目录都有清理策略。

一个简单的巡检脚本可以只输出重点字段:

#!/usr/bin/env bash
set -euo pipefail

target="${1:-/}"
df -i "$target" | awk 'NR==1 || NR==2 {print}'

把它接入监控后,就能在 inode 接近耗尽前提前处理,而不是等服务写文件失败。

清理和总结

实验结束后可以删除临时目录:

rm -rf /tmp/inode-lab

Linux inode 用满的核心判断很简单:`df -h` 看容量,`df -i` 看文件名额。容量没满但 inode 满了,多半是小文件堆积。排查时先定位目录,再确认文件性质,最后按白名单和时间条件清理。真正的长期修复,是给缓存、日志、临时文件和队列目录设置上限与清理策略,并把 inode 使用率纳入监控。

声明:本文转载于:17golang原创 如有侵犯,请联系study_golang@163.com删除
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>