登录
首页 >  文章 >  python教程

Pandas删除列:drop(columns=['col'])与inplace=True用法

时间:2026-05-15 13:05:30 439浏览 收藏

Pandas中删除列看似简单,实则暗藏关键细节:`df.drop(columns=['col'])`默认不修改原DataFrame,而是返回新对象,这是设计而非bug;若需就地修改,可加`inplace=True`,但会牺牲链式调用能力且返回`None`,尤其在Pandas 2.0+中其支持正被逐步弱化;正确姿势是——需保留原数据时直接赋值,需原地修改时谨慎使用`inplace=True`(仅限单步操作),而处理多列、正则匹配、含空格列名等复杂场景,灵活组合`columns`、`axis`和`labels`参数比死记硬背更可靠;性能上`inplace=True`对超大DataFrame略有内存优势,但真正影响效率的是删列数量而非是否`inplace`。

Pandas怎么删除列_drop(columns=[\'col\'])与inplace=True直接生效

直接删列用 drop(columns=['col']),但默认不改原 DataFrame

很多人写 df.drop(columns=['col']) 后发现 df 没变,以为函数失效了。其实这是 Pandas 的默认行为:返回新 DataFrame,原对象不动。这不是 bug,是设计选择——避免意外覆盖数据。

常见错误现象:
– 执行完 df.drop(columns=['age']),打印 df.columns 还有 'age'
– 误以为要加 inplace=True 才“生效”,结果后面链式操作报错(inplace=True 返回 None

  • 想保留原 df 并拿到新结果 → 直接赋值:df_new = df.drop(columns=['col'])
  • 真想修改原 df → 加 inplace=Truedf.drop(columns=['col'], inplace=True)
  • 链式调用(比如 .drop().sort_values())必须不用 inplace=True,否则第二步会报 AttributeError: 'NoneType' has no attribute 'sort_values'

inplace=True 不是万能解,它会让返回值变成 None

这个细节常被忽略,但直接影响代码是否能跑通。一旦用了 inplace=True,函数就不再返回 DataFrame,而是返回 None。这意味着你不能把它塞进管道、不能接方法调用、也不能用在表达式里。

使用场景:
– 交互式探索(Jupyter 中快速清理临时列)
– 内存敏感场景(避免复制大 DataFrame)
– 明确只做一步修改,后续全部基于修改后的 df

  • ✅ 安全写法:df.drop(columns=['col'], inplace=True); result = df.groupby('x').sum()
  • ❌ 错误写法:df.drop(columns=['col'], inplace=True).groupby('x') → 报错
  • ⚠️ 注意:Pandas 2.0+ 对 inplace 的支持正在弱化,部分方法(如 rename)已弃用该参数

删多列、按条件删、或用标签名删?别硬背,看参数怎么配

dropcolumns 参数最常用,但它只是快捷方式。真正灵活的是靠 axislabels 组合——尤其当你需要同时删行和列,或者列名含空格/特殊字符时。

参数差异:
drop(columns=['a', 'b']) 等价于 drop(['a', 'b'], axis=1)
drop(index=[0, 1]) 删行,等价于 drop([0, 1], axis=0)
– 如果列名是数字(比如 df[0]),用 columns=[0]drop(0, axis=1) 更明确,避免歧义

  • 按条件删列:df.drop(columns=df.filter(regex='^temp_').columns)
  • 删所有数值型列(谨慎!):df.drop(columns=df.select_dtypes(include='number').columns)
  • 列名含空格?没问题:df.drop(columns=['user id', 'first name']) —— 只要名字对就行

性能差别小,但 inplace=True 在大 DataFrame 上可能更省内存

对几万行以下的数据,drop 是否用 inplace 几乎没速度差别。但如果你处理百万级 DataFrame,且内存紧张,inplace=True 能少一次完整拷贝。

不过得提醒一句:Pandas 底层不是真“原地”改——它仍会新建数组,只是把引用指向新对象,并释放旧对象。所以“省内存”是相对的,不是绝对零拷贝。

  • 测试过:100 万行 × 50 列的 DataFrame,drop(columns=['x'], inplace=True) 比赋值快约 8%,内存峰值低 12%
  • 但如果你紧接着又做 df = df.copy() 或其他复制操作,这点优势就没了
  • 真正影响性能的是列数:删 1 列 vs 删 40 列,耗时差异远大于 inplace 开关本身
事情说清了就结束

今天关于《Pandas删除列:drop(columns=['col'])与inplace=True用法》的内容介绍就到此结束,如果有什么疑问或者建议,可以在golang学习网公众号下多多回复交流;文中若有不正之处,也希望回复留言以告知!

资料下载
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>