登录
首页 >  文章 >  python教程

Polars标量列广播添加元素方法

时间:2026-01-22 10:33:59 237浏览 收藏

文章小白一枚,正在不断学习积累知识,现将学习到的知识记录一下,也是将我的所得分享给大家!而今天这篇文章《Polars 标量列广播加到列表元素方法》带大家来了解一下##content_title##,希望对大家的知识积累有所帮助,从而弥补自己的不足,助力实战开发!


如何在 Polars 中将标量数值列高效广播加到列表列的每个元素上

Polars 1.10.0+ 支持列表列与标量列的原生广播算术运算,可直接使用 `pl.col("lst") + pl.col("val")` 实现逐元素相加,无需 `map_elements` 或嵌套 `list.eval`,简洁、安全且性能优异。

在 Polars 中对列表列(list[i64])执行“按行广播”式算术操作(如将 val 列的每个标量值加到对应 lst 列中每个元素上),曾长期受限于 list.eval 不支持跨列引用的限制。但自 Polars v1.10.0 起,该功能已原生支持——列表列与数值列之间的加减乘除等二元运算,会自动按行广播:即对第 i 行的 lst[i] 中每个元素,加上第 i 行的 val[i] 值。

✅ 推荐方案(简洁、高效、向量化):

import polars as pl

df = pl.DataFrame({
    'lst': [[0, 1], [9, 8]],
    'val': [3, 4]
})

result = df.with_columns(
    lst=pl.col("lst") + pl.col("val")  # 直接相加,自动广播
)
print(result)

输出:

shape: (2, 2)
┌───────────┬─────┐
│ lst       ┆ val │
│ ---       ┆ --- │
│ list[i64] ┆ i64 │
╞═══════════╪═════╡
│ [3, 4]    ┆ 3   │
│ [13, 12]  ┆ 4   │
└───────────┴─────┘

⚠️ 注意事项:

  • 此语法仅适用于 Polars ≥ 1.10.0。旧版本会报错或静默失败,请先检查版本:pl.__version__。
  • 列表长度无需一致(如 [[1], [2, 3, 4]]),广播逻辑天然兼容变长列表。
  • 支持所有标准算术运算符:+, -, *, /, //, %, **。
  • 若需更复杂逻辑(如条件加法、调用自定义函数),仍需 list.eval(pl.element().apply(...)) 或 map_elements,但应尽量避免后者(非向量化、无类型推断、性能较差)。

? 替代方案(兼容旧版本,但稍冗余):
若必须支持 <1.10.0,可借助 to_struct + 结构体广播(要求列表等长,或显式指定 n_field_strategy="max_width"):

# 仅当列表长度一致时推荐;否则需处理缺失字段
result_legacy = df.with_columns(
    lst=pl.col("lst").list.to_struct(n_field_strategy="max_width")
         + pl.struct(pl.col("val"))
).select(
    pl.col("lst").struct.field("*").alias("lst"),  # 展开为列表(需后续转回)
    "val"
)

但此方式返回 struct 类型,且转换回 list 需额外步骤(如 struct.unnest() + list.from_columns),远不如原生广播直观。

? 总结:升级至 Polars 1.10.0+ 后,pl.col("lst") + pl.col("val") 是最优雅、最高效、最符合 Polars 设计哲学的解决方案——它完全利用底层 Arrow 的向量化能力,零额外开销,代码可读性极佳,应作为首选实践。

以上就是《Polars标量列广播添加元素方法》的详细内容,更多关于的资料请关注golang学习网公众号!

前往漫画官网入口并下载 ➜
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>