Python滑动平均:rolling与expanding详解
时间:2026-04-25 08:45:47 426浏览 收藏
本文深入解析了Pandas中滑动平均的核心操作rolling与expanding,直击开发者高频踩坑点:rolling全返回NaN的根源在于索引非DatetimeIndex或未排序,时间窗口(如'7D')严格依赖已排序的时间索引对齐,而数值窗口(如5)仅按行数滑动;expanding本质是累积计算,与rolling的固定窗口语义截然不同;分组滚动必须通过apply+lambda实现,链式调用会失效;center和closed等对齐参数虽不改变数值结果,却深刻影响结果位置与业务含义(如避免数据泄露)。掌握这些细节,才能让滑动平均真正可靠、精准、可解释。

rolling 为什么算出来全是 NaN?检查 index 和 freq 是否对齐
常见错误是直接对无序或非时间索引的 DataFrame 调用 rolling(window='7D'),结果全为 NaN。Pandas 的时间窗口(如 '7D')要求索引是 DatetimeIndex 且已排序,否则无法按时间对齐滑动。
- 先确认索引类型:
df.index.dtype应为datetime64[ns] - 若原始数据是列而非索引,需先设为索引:
df.set_index('date_col', inplace=True) - 务必排序:
df = df.sort_index(),否则rolling按原始行序滑动,不是按时间滑动 - 非时间窗口(如
rolling(5))只认行数,不依赖 index,适合数值序列或已按序排列的指标
expanding 和 rolling 的本质区别:累积 vs 固定长度
expanding() 是从第一行开始累积计算,窗口长度逐行增长;rolling(window=3) 始终只看最近 3 行(或 3 个时间单位)。二者语义不同,不能混用替代。
df['col'].expanding().mean()第 1 行 = 第 1 行值,第 2 行 = 前 2 行均值,第 n 行 = 前 n 行均值df['col'].rolling(3).mean()前 2 行固定返回NaN(因不足 3 个),第 3 行起才开始有值- 想实现“至少 2 个点就出结果”,可加
min_periods=2参数:rolling(3, min_periods=2) expanding不支持时间偏移(如'7D'),只接受整数或None
groupby 后做 rolling:必须用 apply + lambda,不能链式调用
对分组数据做滑动计算时,df.groupby('category').rolling(5)['value'].mean() 看似合理,但实际会报 KeyError 或返回错乱结构——因为 rolling 在 groupby 后不直接支持列选择语法。
- 正确写法:
df.groupby('category')['value'].apply(lambda x: x.rolling(5).mean()) - 若需保留原始索引(避免多级索引),加
reset_index(name='rolling_mean') - 性能注意:
apply是 Python 循环,大数据量时比向量化慢;若分组多、每组小,影响不大;若每组很大,考虑先sort_values再整体rolling加布尔掩码过滤 - 时间窗口分组滚动(如每组内按天滚动 7 天)更复杂,需确保组内 index 是
DatetimeIndex且已排序
rolling 计算后如何对齐结果?center 参数和 closed 选项常被忽略
默认 rolling(window=3) 的结果中,第 3 行对应的是第 1–3 行的计算值,即右对齐(closed='right')。但有时你需要中心对齐(比如画图时希望均值标在中间时间点),或左闭右开等语义。
- 中心对齐:
rolling(3, center=True)→ 窗口为 [i-1, i, i+1],结果放在第 i 行,前/后各缺 1 行为NaN - 控制闭合方式:
rolling(3, closed='left')表示取 [i-3, i-2, i-1],结果放第 i 行;closed='both'(默认)取 [i-2, i-1, i] - 时间窗口下
closed更关键,例如rolling('7D', closed='left')不包含当前时刻,适合避免数据泄露场景 - 所有这些参数不影响计算逻辑,只改变“哪几行参与计算”以及“结果落在哪一行”
closed 和 center 的语义误读——它们不改数值,只改对齐方式,但一旦画图或拼接就立刻暴露。理论要掌握,实操不能落!以上关于《Python滑动平均:rolling与expanding详解》的详细介绍,大家都掌握了吧!如果想要继续提升自己的能力,那么就来关注golang学习网公众号吧!
相关阅读
更多>
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
最新阅读
更多>
-
306 收藏
-
408 收藏
-
144 收藏
-
327 收藏
-
203 收藏
-
341 收藏
-
414 收藏
-
271 收藏
-
413 收藏
-
112 收藏
-
413 收藏
-
274 收藏
课程推荐
更多>
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 485次学习