登录
首页 >  文章 >  python教程

Matplotlib多图导出PDF,PdfPages批量保存教程

时间:2026-05-21 14:16:15 389浏览 收藏

本文详解了使用Matplotlib的PdfPages高效、稳定导出多图PDF的核心技巧与避坑指南:强调必须显式调用close()防止文件为空、每次绘图前新建figure或明确传入fig对象避免图表重叠,通过设置figsize、tight_layout和统一字体(尤其中文)保障排版清晰美观,利用fig.text添加页码、infodict写入元数据提升专业性,并针对大批量图表给出内存优化策略——如及时close figure、复用ax、分批导出及手动触发canvas.draw(),全面覆盖从入门到高阶生产环境的常见痛点与最佳实践。

Python中如何将多个Matplotlib图表保存为PDF_使用PdfPages类批量导出

PdfPages类的基本用法和常见报错

直接用 PdfPages 保存多图 PDF 是最稳妥的方式,但新手常卡在“文件没关闭导致内容为空”或“图表不显示”上。核心就两点:必须显式调用 close(),且每张图要先 plt.figure() 或用 fig 对象明确控制。

典型错误是循环里反复用 plt.plot() 却没清空或新建 figure,结果所有数据叠在一张图上,最后 PDF 只有一页、内容混乱。

  • 每次绘图前加 plt.figure(figsize=(8, 6)),避免复用默认 figure
  • 画完立刻用 pdf.savefig(fig)(推荐传 figure 对象)或 pdf.savefig()(捕获当前 active figure)
  • 循环结束后务必调用 pdf.close(),否则 PDF 文件大小为 0 字节
  • 不要在 with PdfPages(...) 外部再调用 plt.show(),容易触发 backend 冲突

如何避免图表重叠和尺寸错乱

PDF 页面默认是 A4 尺寸(约 8.27×11.69 英寸),而 Matplotlib 默认 figure 是 6.4×4.8 英寸。如果没设 figsize,多图排版会挤压、字体变小、坐标轴截断。

更隐蔽的问题是:用 plt.subplot()plt.subplots() 创建的图,若未指定 fig 变量,pdf.savefig() 可能抓不到正确对象。

  • 统一用面向对象方式:创建 fig, ax = plt.subplots(figsize=(8, 5)),后续操作全走 ax.plot()
  • 保存时传 pdf.savefig(fig),不依赖当前 active 状态
  • 如需统一字体/边距,可在循环外调用 plt.rcParams.update({...}),但注意它会影响后续所有图
  • 导出前加 plt.tight_layout(),防止标题或标签被裁切

带标题、页码和自定义元数据的 PDF

PdfPages 支持写入 PDF 元信息(作者、标题等),也能在每页加文字水印或页码——但不能用 plt.text() 直接写在 figure 上,因为那是绘图内容;页码得靠 pdf.infodict() 和手动插入文本 artist。

  • 初始化后立即设置元数据:pdf.infodict()['Title'] = 'My Report',支持 'Author''Subject'
  • 页码建议用 fig.text(0.95, 0.02, f'p.{i+1}', ha='right', fontsize=9) 插入右下角(i 是循环索引)
  • 避免在 plt.suptitle() 里写动态内容(如日期),它可能和 tight_layout() 冲突;改用 fig.suptitle(...) 并手动调整 fig.subplots_adjust(top=0.92)
  • 中文标题需提前设置字体:plt.rcParams['font.sans-serif'] = ['SimHei', 'DejaVu Sans'],否则显示方块

性能与大图数量下的注意事项

导出上百张图时,内存会持续增长——因为 PdfPages 在内部缓存所有 figure 的 rasterized 数据,直到 close() 才写入磁盘。卡顿、OOM 常因此发生。

  • 每画完 10–20 张图,可手动调用 plt.close(fig)plt.close('all') 释放 figure 对象
  • 避免在循环中反复 import matplotlib.pyplot as plt 或修改全局 rcParams
  • 若图表结构一致(如时间序列批量绘图),优先用 ax.clear() 复用同一 figure+ax,比新建更快
  • 极大量图表(>500)建议分批次写入多个 PDF,或改用 cairocffi + matplotlib.backends.backend_cairo 降低内存压力

最容易被忽略的是:PDF 导出不触发自动重绘(draw()),所以如果图中用了延迟渲染(如某些 basemap 或 cartopy 图层),需在 savefig() 前加 fig.canvas.draw(),否则页面空白。

文中关于的知识介绍,希望对你的学习有所帮助!若是受益匪浅,那就动动鼠标收藏这篇《Matplotlib多图导出PDF,PdfPages批量保存教程》文章吧,也可关注golang学习网公众号了解相关技术文章。

资料下载
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>