登录
首页 >  文章 >  python教程

Python定时清理过期日志脚本教程

时间:2026-05-23 17:17:14 445浏览 收藏

本文详解了如何用Python安全、可靠地实现日志文件的定时清理,聚焦于准确判断文件过期(基于修改时间而非易误导的创建时间)、规范路径处理、推荐现代pathlib替代传统os模块操作、谨慎处理目录删除与异常捕获,并强调生产环境中避免误删和静默失败的关键实践——从时间戳单位统一、is_file()校验、权限适配到日志记录与进程占用预检,帮你写出真正稳健可用的日志清理脚本。

怎样用Python脚本定期清空指定目录下的过期日志

os.listdir() + os.path.getmtime() 判断文件是否过期

核心逻辑是遍历目录,获取每个文件的最后修改时间,和当前时间比对是否超过保留天数。注意:os.path.getmtime() 返回的是时间戳(秒级),不是 datetime 对象,直接减法会出错;得统一转成 time.time() 的单位做比较。

常见错误是误用 os.path.getctime() —— 在 Linux 上它是“inode 创建时间”,不等于“文件创建时间”,且日志轮转后可能被重写,mtime 更可靠。

实操建议:

  • time.time() - os.path.getmtime(path) > days * 86400 判断是否过期(避免引入 datetime 增加复杂度)
  • 先用 os.path.isfile(path) 过滤掉子目录,否则删目录会报 IsADirectoryError
  • 路径拼接务必用 os.path.join(root, f),别用字符串拼接,Windows 下会出错

pathlib.Path.rglob() 替代递归遍历更简洁

如果需要清理子目录里的日志(比如 logs/app1/logs/app2/),os.walk() 写起来啰嗦。pathlib 是 Python 3.4+ 的推荐方式,.rglob("*.log") 一行就能扫全匹配文件。

注意点:

  • rglob() 返回的是 Path 对象,调 .stat().st_mtime 拿修改时间,不是 .getmtime()
  • 删除前加 if p.is_file(): 防止误删空目录(rglob 可能匹配到目录名含 .log 的文件夹)
  • 不要用 p.unlink(missing_ok=True)(Python 3.8+ 才支持),低版本需包 try/except FileNotFoundError

shutil.rmtree() 清理整个过期日志目录时要格外小心

有些场景要求“清空整个目录”(比如每天生成一个 logs/2024-05-01/),而不是只删文件。这时不能只遍历删内容,得判断目录本身的修改时间。

关键风险:

  • shutil.rmtree() 不回收站,删完不可逆;必须先 print() 或记录到日志里待删路径
  • 不能对 logs/ 根目录本身做时间判断——它可能长期存在,应判断其子目录名是否含日期,或用 path.stat().st_mtime
  • 若目录非空但含只读文件(如某些日志库生成的 .gz),rmtree() 会失败;加 onerror 回调临时改权限再删

logging 和异常捕获避免脚本静默失败

定时任务里最怕脚本跑一半卡住或报错退出却不通知。尤其 PermissionError(文件正被写入)、OSError: [WinError 32](Windows 下进程占用)很常见。

最小可用建议:

  • logging.basicConfig(level=logging.INFO, filename="cleanup.log") 记录删了哪些、跳过了哪些
  • 每个 os.remove()path.unlink()try/except (OSError, PermissionError) as e:logging.warning(f"skip {path}: {e}")
  • 别用 sys.exit(1) 中断整个流程——单个文件失败不该影响其他清理

真正难的不是写几行删除代码,而是确认“这个文件此刻真的没被任何进程打开”。生产环境建议配合 lsof(Linux/macOS)或 handle.exe(Windows)预检,或者让日志框架本身支持按大小/时间自动轮转并删除旧文件——脚本只是兜底手段。

终于介绍完啦!小伙伴们,这篇关于《Python定时清理过期日志脚本教程》的介绍应该让你收获多多了吧!欢迎大家收藏或分享给更多需要学习的朋友吧~golang学习网公众号也会发布文章相关知识,快来关注吧!

资料下载
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>