PandasDataFrame指定行应用函数技巧
时间:2026-01-28 14:24:37 286浏览 收藏
“纵有疾风来,人生不言弃”,这句话送给正在学习文章的朋友们,也希望在阅读本文《Pandas DataFrame 指定索引行应用函数方法》后,能够真的帮助到大家。我也会在后续的文章中,陆续更新文章相关的技术文章,有好的建议欢迎大家在评论留言,非常感谢!

本文介绍如何高效地将一个返回多值的 Python 函数(如 `computeLeft`)仅应用于 DataFrame 的特定行索引,并自动填充其余位置为 NaN,避免全量计算,兼顾可读性与性能。
在实际数据处理中,我们常需对 DataFrame 的部分行(而非全部)执行复杂计算,并将结果写入多个列。例如,函数 computeLeft(i) 接收索引 i,返回长度为 4 的 NumPy 数组 [2*i, 3*i, 4*i, 5*i],期望将其结果分别填入 ["val1","val2","val3","val4"] 四列中,但仅针对指定索引(如 [2, 5, 7, 8, 10]),其余行保持为 NaN。
直接使用 np.vectorize 全量计算(如 df[results] = np.vectorize(...)(range(len(df))))虽可行,但效率低且不满足“选择性执行”需求。正确做法分三步:
- 预分配目标列并初始化为 NaN:确保所有行都有占位,未计算行自然为空;
- 构造索引列表:明确要计算的行索引(注意:是 DataFrame 的 index 标签,非 .iloc 位置序号);
- 用 df.loc[indices, columns] 定向赋值:结合向量化函数,精准写入。
以下是完整、健壮的实现代码:
import numpy as np
import pandas as pd
def computeLeft(i):
return np.array([i * 2, i * 3, i * 4, i * 5])
# 向量化(支持输出为 (4,) 形状数组)
computeLeftVec = np.vectorize(computeLeft, signature="()->(4)")
# 假设 df 已存在,例如:
# df = pd.DataFrame(index=range(15), data={"x": range(15)})
results = ["val1", "val2", "val3", "val4"]
df[results] = np.nan # 预分配,全部设为 NaN
indices_to_change = [2, 5, 7, 8, 10]
# ✅ 关键:loc 使用 index 标签匹配,要求 indices_to_change 中的值必须存在于 df.index 中
df.loc[indices_to_change, results] = computeLeftVec(indices_to_change)⚠️ 重要注意事项:
- df.loc[indices_to_change, ...] 依赖的是 DataFrame 的 index 标签(即行名),而非整数位置。若你的 DataFrame 索引不是默认 RangeIndex(如已重设为字符串或缺失部分整数),请先确认 indices_to_change 中的值确实在 df.index 中,否则会静默忽略或报错。可通过 assert set(indices_to_change).issubset(df.index) 验证。
- 若需按位置序号(iloc) 而非标签索引操作,请改用:
pos_indices = [2, 5, 7, 8, 10] # 行位置(0-based) df.iloc[pos_indices, df.columns.get_indexer(results)] = computeLeftVec(pos_indices)
- 性能优化建议:对于纯数值运算(如本例),直接用 NumPy 广播替代 np.vectorize 更快:
idx_arr = np.array(indices_to_change) values = np.column_stack([idx_arr * 2, idx_arr * 3, idx_arr * 4, idx_arr * 5]) df.loc[indices_to_change, results] = values
该方法简洁、语义清晰,充分利用了 Pandas 的索引对齐特性,是生产环境中推荐的选择性函数应用模式。
好了,本文到此结束,带大家了解了《PandasDataFrame指定行应用函数技巧》,希望本文对你有所帮助!关注golang学习网公众号,给大家分享更多文章知识!
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
338 收藏
-
341 收藏
-
490 收藏
-
479 收藏
-
131 收藏
-
267 收藏
-
469 收藏
-
271 收藏
-
310 收藏
-
453 收藏
-
496 收藏
-
116 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 485次学习