Pandas删除列:drop(columns=['col'])与inplace=True用法
时间:2026-05-15 13:05:30 439浏览 收藏
Pandas中删除列看似简单,实则暗藏关键细节:`df.drop(columns=['col'])`默认不修改原DataFrame,而是返回新对象,这是设计而非bug;若需就地修改,可加`inplace=True`,但会牺牲链式调用能力且返回`None`,尤其在Pandas 2.0+中其支持正被逐步弱化;正确姿势是——需保留原数据时直接赋值,需原地修改时谨慎使用`inplace=True`(仅限单步操作),而处理多列、正则匹配、含空格列名等复杂场景,灵活组合`columns`、`axis`和`labels`参数比死记硬背更可靠;性能上`inplace=True`对超大DataFrame略有内存优势,但真正影响效率的是删列数量而非是否`inplace`。
![Pandas怎么删除列_drop(columns=[\'col\'])与inplace=True直接生效](/uploads/20260515/17788215076a06a9830abbb.png)
直接删列用 drop(columns=['col']),但默认不改原 DataFrame
很多人写 df.drop(columns=['col']) 后发现 df 没变,以为函数失效了。其实这是 Pandas 的默认行为:返回新 DataFrame,原对象不动。这不是 bug,是设计选择——避免意外覆盖数据。
常见错误现象:
– 执行完 df.drop(columns=['age']),打印 df.columns 还有 'age'
– 误以为要加 inplace=True 才“生效”,结果后面链式操作报错(inplace=True 返回 None)
- 想保留原
df并拿到新结果 → 直接赋值:df_new = df.drop(columns=['col']) - 真想修改原
df→ 加inplace=True:df.drop(columns=['col'], inplace=True) - 链式调用(比如
.drop().sort_values())必须不用inplace=True,否则第二步会报AttributeError: 'NoneType' has no attribute 'sort_values'
inplace=True 不是万能解,它会让返回值变成 None
这个细节常被忽略,但直接影响代码是否能跑通。一旦用了 inplace=True,函数就不再返回 DataFrame,而是返回 None。这意味着你不能把它塞进管道、不能接方法调用、也不能用在表达式里。
使用场景:
– 交互式探索(Jupyter 中快速清理临时列)
– 内存敏感场景(避免复制大 DataFrame)
– 明确只做一步修改,后续全部基于修改后的 df
- ✅ 安全写法:
df.drop(columns=['col'], inplace=True); result = df.groupby('x').sum() - ❌ 错误写法:
df.drop(columns=['col'], inplace=True).groupby('x')→ 报错 - ⚠️ 注意:Pandas 2.0+ 对
inplace的支持正在弱化,部分方法(如rename)已弃用该参数
删多列、按条件删、或用标签名删?别硬背,看参数怎么配
drop 的 columns 参数最常用,但它只是快捷方式。真正灵活的是靠 axis 和 labels 组合——尤其当你需要同时删行和列,或者列名含空格/特殊字符时。
参数差异:
– drop(columns=['a', 'b']) 等价于 drop(['a', 'b'], axis=1)
– drop(index=[0, 1]) 删行,等价于 drop([0, 1], axis=0)
– 如果列名是数字(比如 df[0]),用 columns=[0] 比 drop(0, axis=1) 更明确,避免歧义
- 按条件删列:
df.drop(columns=df.filter(regex='^temp_').columns) - 删所有数值型列(谨慎!):
df.drop(columns=df.select_dtypes(include='number').columns) - 列名含空格?没问题:
df.drop(columns=['user id', 'first name'])—— 只要名字对就行
性能差别小,但 inplace=True 在大 DataFrame 上可能更省内存
对几万行以下的数据,drop 是否用 inplace 几乎没速度差别。但如果你处理百万级 DataFrame,且内存紧张,inplace=True 能少一次完整拷贝。
不过得提醒一句:Pandas 底层不是真“原地”改——它仍会新建数组,只是把引用指向新对象,并释放旧对象。所以“省内存”是相对的,不是绝对零拷贝。
- 测试过:100 万行 × 50 列的 DataFrame,
drop(columns=['x'], inplace=True)比赋值快约 8%,内存峰值低 12% - 但如果你紧接着又做
df = df.copy()或其他复制操作,这点优势就没了 - 真正影响性能的是列数:删 1 列 vs 删 40 列,耗时差异远大于
inplace开关本身
今天关于《Pandas删除列:drop(columns=['col'])与inplace=True用法》的内容介绍就到此结束,如果有什么疑问或者建议,可以在golang学习网公众号下多多回复交流;文中若有不正之处,也希望回复留言以告知!
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
268 收藏
-
111 收藏
-
445 收藏
-
439 收藏
-
470 收藏
-
448 收藏
-
495 收藏
-
177 收藏
-
174 收藏
-
330 收藏
-
381 收藏
-
388 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 485次学习