PythonExcel数据分析:openpyxl与pandas教程
时间:2026-02-07 11:08:32 318浏览 收藏
golang学习网今天将给大家带来《PythonExcel数据分析:openpyxl与pandas实战教程》,感兴趣的朋友请继续看下去吧!以下内容将会涉及到等等知识点,如果你是正在学习文章或者已经是大佬级别了,都非常欢迎也希望大家都能给我建议评论哈~希望能帮助到大家!
openpyxl与pandas分工协作:pandas负责数据清洗计算,openpyxl负责格式化呈现;pandas读写会丢失样式,需用openpyxl操作模板、填入结果并设置格式、条件高亮等。

用 Python 做 Excel 数据统计分析,openpyxl 负责精细格式控制和已有文件操作,pandas 负责高效清洗与计算——二者不是替代关系,而是分工协作。关键在于:先用 pandas 处理逻辑,再用 openpyxl 落地呈现。
一、为什么不能只用 pandas 读写 Excel?
pandas 的 read_excel() 和 to_excel() 底层依赖 openpyxl(或 xlsxwriter)引擎,但它们会丢弃原工作表的样式、合并单元格、图表、批注等非数据信息。如果你要保留模板格式、自动适配列宽、加边框或高亮异常值,就必须切换到 openpyxl 手动操作。
- ✅ pandas:适合读取原始数据 → 清洗 → 汇总 → 生成新表格
- ✅ openpyxl:适合打开已有报表模板 → 填入 pandas 计算结果 → 设置字体/颜色/边框 → 保存为“可交付版”
- ❌ 单用 pandas.to_excel():生成的是“干净但无格式”的表格,常被业务方退回重做
二、典型协作流程:销售报表自动化
假设你有一份《月度销售汇总.xlsx》模板,含固定标题、公司 logo 单元格、预设边框和“数据区”占位符(如 A10 开始)。真实数据来自数据库或 CSV,需填入并高亮超目标门店。
操作分三步:
- 1. 用 pandas 加载并计算:读原始数据,按区域聚合销售额、计算完成率、标记达标状态
- 2. 用 openpyxl 打开模板:定位“数据区”起始单元格(如 ws['A10']),逐行写入 pandas 的结果(注意:openpyxl 不支持直接写 DataFrame,需转成列表或循环赋值)
- 3. 格式增强:对完成率列设置条件格式(如 >100% 填绿色)、自动调整列宽、冻结首行、保存为新文件
三、关键代码片段(不粘贴完整脚本,只讲核心)
▶ 写入数据(避免逐单元格 for 循环太慢)
用 ws.append() 批量追加一行行数据,比 ws.cell(row=..., column=...).value = ... 快得多:
for r in dataframe_to_rows(df_result, index=False, header=False):
ws.append(r)
▶ 高亮达标行(openpyxl 条件格式示例)
不是靠 if 判断每行,而是用内置条件格式规则:
rule = CellIsRule(operator='greaterThan', formula=['1'], stopIfTrue=True,
fill=PatternFill(start_color='C6EFCE', end_color='C6EFCE', fill_type='solid'))
ws.conditional_formatting.add('E10:E100', rule) # 假设完成率在 E 列
四、避坑提醒
- openpyxl 默认从 1 开始计数(row=1, column=1),pandas 的 .iloc[] 从 0 开始——写入前注意索引偏移
- 写入数字时,openpyxl 可能自动识别为字符串(尤其带逗号或百分号),建议显式转类型:
float(val)或int(val) - 如果模板含公式(如 =SUM(B10:B20)),openpyxl 不会重算——要么用
workbook.data_only = True读取已计算值,要么写入后用 Excel 手动刷新 - 中文路径/文件名务必用 UTF-8 编码打开,否则报错
UnicodeDecodeError
理论要掌握,实操不能落!以上关于《PythonExcel数据分析:openpyxl与pandas教程》的详细介绍,大家都掌握了吧!如果想要继续提升自己的能力,那么就来关注golang学习网公众号吧!
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
336 收藏
-
462 收藏
-
376 收藏
-
130 收藏
-
441 收藏
-
198 收藏
-
354 收藏
-
405 收藏
-
420 收藏
-
117 收藏
-
320 收藏
-
483 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 485次学习