Matplotlib多图导出PDF,PdfPages批量保存教程
时间:2026-05-21 14:16:15 389浏览 收藏
本文详解了使用Matplotlib的PdfPages高效、稳定导出多图PDF的核心技巧与避坑指南:强调必须显式调用close()防止文件为空、每次绘图前新建figure或明确传入fig对象避免图表重叠,通过设置figsize、tight_layout和统一字体(尤其中文)保障排版清晰美观,利用fig.text添加页码、infodict写入元数据提升专业性,并针对大批量图表给出内存优化策略——如及时close figure、复用ax、分批导出及手动触发canvas.draw(),全面覆盖从入门到高阶生产环境的常见痛点与最佳实践。

PdfPages类的基本用法和常见报错
直接用 PdfPages 保存多图 PDF 是最稳妥的方式,但新手常卡在“文件没关闭导致内容为空”或“图表不显示”上。核心就两点:必须显式调用 close(),且每张图要先 plt.figure() 或用 fig 对象明确控制。
典型错误是循环里反复用 plt.plot() 却没清空或新建 figure,结果所有数据叠在一张图上,最后 PDF 只有一页、内容混乱。
- 每次绘图前加
plt.figure(figsize=(8, 6)),避免复用默认 figure - 画完立刻用
pdf.savefig(fig)(推荐传 figure 对象)或pdf.savefig()(捕获当前 active figure) - 循环结束后务必调用
pdf.close(),否则 PDF 文件大小为 0 字节 - 不要在
with PdfPages(...)外部再调用plt.show(),容易触发 backend 冲突
如何避免图表重叠和尺寸错乱
PDF 页面默认是 A4 尺寸(约 8.27×11.69 英寸),而 Matplotlib 默认 figure 是 6.4×4.8 英寸。如果没设 figsize,多图排版会挤压、字体变小、坐标轴截断。
更隐蔽的问题是:用 plt.subplot() 或 plt.subplots() 创建的图,若未指定 fig 变量,pdf.savefig() 可能抓不到正确对象。
- 统一用面向对象方式:创建
fig, ax = plt.subplots(figsize=(8, 5)),后续操作全走ax.plot() - 保存时传
pdf.savefig(fig),不依赖当前 active 状态 - 如需统一字体/边距,可在循环外调用
plt.rcParams.update({...}),但注意它会影响后续所有图 - 导出前加
plt.tight_layout(),防止标题或标签被裁切
带标题、页码和自定义元数据的 PDF
PdfPages 支持写入 PDF 元信息(作者、标题等),也能在每页加文字水印或页码——但不能用 plt.text() 直接写在 figure 上,因为那是绘图内容;页码得靠 pdf.infodict() 和手动插入文本 artist。
- 初始化后立即设置元数据:
pdf.infodict()['Title'] = 'My Report',支持'Author'、'Subject' - 页码建议用
fig.text(0.95, 0.02, f'p.{i+1}', ha='right', fontsize=9)插入右下角(i是循环索引) - 避免在
plt.suptitle()里写动态内容(如日期),它可能和tight_layout()冲突;改用fig.suptitle(...)并手动调整fig.subplots_adjust(top=0.92) - 中文标题需提前设置字体:
plt.rcParams['font.sans-serif'] = ['SimHei', 'DejaVu Sans'],否则显示方块
性能与大图数量下的注意事项
导出上百张图时,内存会持续增长——因为 PdfPages 在内部缓存所有 figure 的 rasterized 数据,直到 close() 才写入磁盘。卡顿、OOM 常因此发生。
- 每画完 10–20 张图,可手动调用
plt.close(fig)或plt.close('all')释放 figure 对象 - 避免在循环中反复
import matplotlib.pyplot as plt或修改全局 rcParams - 若图表结构一致(如时间序列批量绘图),优先用
ax.clear()复用同一 figure+ax,比新建更快 - 极大量图表(>500)建议分批次写入多个 PDF,或改用
cairocffi+matplotlib.backends.backend_cairo降低内存压力
最容易被忽略的是:PDF 导出不触发自动重绘(draw()),所以如果图中用了延迟渲染(如某些 basemap 或 cartopy 图层),需在 savefig() 前加 fig.canvas.draw(),否则页面空白。
文中关于的知识介绍,希望对你的学习有所帮助!若是受益匪浅,那就动动鼠标收藏这篇《Matplotlib多图导出PDF,PdfPages批量保存教程》文章吧,也可关注golang学习网公众号了解相关技术文章。
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
404 收藏
-
418 收藏
-
265 收藏
-
389 收藏
-
498 收藏
-
122 收藏
-
479 收藏
-
186 收藏
-
124 收藏
-
332 收藏
-
318 收藏
-
420 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 485次学习