MySQL 临时表打满磁盘复盘:报表接口从超时到恢复
来源:17golang原创
时间:2026-06-29 17:15:30 114浏览 收藏
线上报表接口突然超时,应用日志只看到请求超过 30 秒,MySQL 慢日志里出现大量 Using temporary 和 Using filesort。几分钟后,数据库所在磁盘空间告警,部分查询开始报错。这个场景很容易被误判成“普通慢 SQL”,但真正的问题可能是临时表落盘后持续放大,最终把磁盘打满。
本文按一次故障复盘的方式拆解:影响面是什么,时间线怎么推进,哪个条件触发了临时表落盘,根因如何确认,临时怎么止血,后续怎么避免同类问题再次发生。
- 影响面:报表接口超时并伴随磁盘告警
- 时间线:从慢请求到磁盘空间耗尽
- 触发条件:大范围 GROUP BY 让临时表落盘
- 根因定位:不是单次慢,而是临时表持续堆积
- 修复动作:先止血,再改查询路径
- 防复发:监控临时表、限制范围和预聚合
影响面:报表接口超时并伴随磁盘告警
故障最先从业务侧暴露出来:运营后台打开“订单渠道日报”时,页面一直转圈,最后提示请求超时。接口层看到的是 /api/report/channel-daily 多次超过 30 秒。
数据库侧同时出现两个信号:
- 慢日志里同一条聚合 SQL 反复出现,扫描行数超过百万。
- 磁盘剩余空间快速下降,随后触发空间告警。
这说明问题不是单个请求偶发慢,而是某类查询在高频访问下持续消耗数据库资源。此时处理目标有两个:先保护数据库磁盘空间,再定位报表 SQL 为什么制造大量临时数据。

时间线:从慢请求到磁盘空间耗尽
按时间线梳理,故障过程大致是这样:
- 10:02:新报表入口上线,默认查询最近 90 天数据。
- 10:06:运营同事开始集中访问,接口 P95 延迟升到 18 秒。
- 10:09:慢日志出现多条
Using temporary; Using filesort。 - 10:12:磁盘空间告警,临时目录所在分区剩余不足 10%。
- 10:15:临时关闭报表入口,数据库压力开始回落。
这个时间线很关键。它说明数据库不是一开始就不可用,而是在新报表入口上线后,被大量宽范围聚合查询逐步压垮。排查时不能只盯一条最慢 SQL,还要看它被调用的频率和临时数据增长速度。
触发条件:大范围 GROUP BY 让临时表落盘
触发 SQL 简化后类似下面这样:
SELECT channel, DATE(created_at) AS day, COUNT(*) AS order_count, SUM(pay_amount) AS pay_amount FROM orders WHERE created_at >= '2026-03-01' AND created_at
这条 SQL 有几个危险点:
- 默认时间范围太大,一次扫描三个月订单。
DATE(created_at)让分组表达式和索引顺序不完全匹配。GROUP BY加ORDER BY需要额外排序。- 并发访问时,每个查询都可能生成自己的临时表。
当内存临时表放不下时,MySQL 会把临时表写到磁盘。单次查询慢还不是最坏情况,真正危险的是多个大查询同时执行,磁盘临时文件持续增长。
根因定位:不是单次慢,而是临时表持续堆积
定位时可以先看几个状态指标:
SHOW GLOBAL STATUS LIKE 'Created_tmp%'; SHOW GLOBAL STATUS LIKE 'Sort_merge_passes'; SHOW VARIABLES LIKE 'tmpdir';
如果 Created_tmp_disk_tables 在故障期间快速增长,并且 tmpdir 所在磁盘空间同步下降,就可以把排查方向从“普通慢查询”推进到“磁盘临时表放大”。

再结合 EXPLAIN 查看执行计划:
EXPLAIN SELECT channel, DATE(created_at) AS day, COUNT(*), SUM(pay_amount) FROM orders WHERE created_at >= '2026-03-01' AND created_at
如果 Extra 里出现 Using temporary 和 Using filesort,并且扫描行数很大,就能解释为什么报表访问一多就把临时目录打满。
修复动作:先止血,再改查询路径
这类故障不要一开始就重构报表。先止血,恢复数据库空间和业务可用性。
第一步:限制入口
临时关闭报表入口,或把默认时间范围从 90 天缩到 7 天,阻止新的大范围聚合继续进入数据库。
第二步:清理和扩容临时空间
确认没有长期运行的大查询后,再处理临时目录空间。必要时把 tmpdir 放到空间更充足的分区,但这只是缓解,不是根治。
第三步:改查询模型
日报表更适合预聚合。可以每天或每小时把渠道维度写入汇总表:
CREATE TABLE order_channel_daily ( stat_day DATE NOT NULL, channel VARCHAR(32) NOT NULL, order_count BIGINT NOT NULL, pay_amount DECIMAL(12,2) NOT NULL, PRIMARY KEY (stat_day, channel) );
查询报表时直接读汇总表,避免每次都从订单明细表现场聚合。
防复发:监控临时表、限制范围和预聚合
故障恢复后,要把防线补齐。
- 监控
Created_tmp_disk_tables增速,而不是只看慢日志。 - 监控
tmpdir所在分区空间,设置更早的告警阈值。 - 报表入口限制最大时间范围,默认不要给 90 天或全量。
- 高频报表走汇总表或缓存,明细表只用于追查。
- 上线前用接近生产的数据量验证
EXPLAIN和接口耗时。
复盘的结论不是“以后不要用 GROUP BY”,而是大范围、高并发、实时聚合不能直接压到明细表上。报表系统要把查询范围、预聚合、临时表监控和降级入口一起设计。
总结
MySQL 临时表打满磁盘通常不是一个孤立 SQL 的问题,而是查询范围、排序分组、并发访问和临时目录空间共同作用的结果。排查时按时间线看影响面,结合 Created_tmp_disk_tables、tmpdir 空间和 EXPLAIN 定位根因;修复时先限制入口止血,再改成汇总表或更小范围查询;最后把临时表和磁盘空间纳入监控,才能真正防复发。
-
100 收藏
-
100 收藏
-
100 收藏
-
100 收藏
-
100 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 485次学习