首页 > 文章 > python教程

Pandas转多级嵌套字典技巧

时间：2026-01-27 23:39:41 298浏览收藏

一分耕耘，一分收获！既然都打开这篇《Pandas DataFrame转多级嵌套字典方法》，就坚持看下去，学下去吧！本文主要会给大家讲到等等知识点，如果大家对本文有好的建议或者看到有不足之处，非常欢迎大家积极提出！在后续文章我会继续更新文章相关的内容，希望对大家都有所帮助！

如何将 Pandas DataFrame 高效转换为多级嵌套字典

本文介绍一种无需双重 for 循环的简洁方法，利用 `groupby().apply()` 的嵌套调用，将 DataFrame 按多个列分组并转换为深度嵌套字典（如 `{col1: {col2: [{record}, ...]}}`，兼顾可读性与性能。

在数据处理中，常需将扁平化的 DataFrame 转换为结构化嵌套字典，以适配 API 请求、配置生成或前端树形渲染等场景。传统双重 for 循环虽直观，但代码冗长、可维护性差，且难以扩展至三层及以上层级。

Pandas 提供了更优雅的函数式方案：通过链式 groupby().apply() 实现多级嵌套。核心思路是逐层分组，并在最内层将子 DataFrame 转为记录列表（to_dict(orient='records')），外层则自动聚合为字典。

以下为推荐实现（兼容 pandas ≥ 1.3）：

import pandas as pd

# 构造示例数据（同原问题）
a = pd.DataFrame([
    {'col1': 'A', 'col2': 'Person 1', 'height': 1, 'weight': 10},
    {'col1': 'A', 'col2': 'Person 1', 'height': 2, 'weight': 20},
    {'col1': 'A', 'col2': 'Person 2', 'height': 4, 'weight': 40},
    {'col1': 'B', 'col2': 'Person 1', 'height': 11, 'weight': 101},
    {'col1': 'B', 'col2': 'Person 2', 'height': 41, 'weight': 401},
])

# ✅ 推荐：单行嵌套 groupby + apply
result = (
    a.groupby('col1')
     .apply(lambda x: x.groupby('col2').apply(lambda y: y.to_dict('records')))
     .to_dict()
)

该写法输出结构与原始双循环完全一致：外层键为 'col1' 值（如 'A'），中层键为 'col2' 值（如 'Person 1'），末层为对应分组的完整记录列表（含所有原始字段）。

⚠️ 注意事项：
to_dict() 在 Series 上默认返回 {'index': value} 形式，但此处因 apply() 返回的是 pd.Series（索引为 col2 值，值为列表），调用 .to_dict() 会自动映射为 {col2_value: record_list}，无需额外处理；
若需支持 三层嵌套（如 col1 → col2 → col3），可继续嵌套：.groupby('col1').apply(...).groupby('col2').apply(...).groupby('col3').apply(...).to_dict()，但建议封装为递归函数提升可读性；
对于超大数据集，apply 可能略慢于向量化操作；若仅需特定字段，可先用 [['col2', 'height', 'weight']] 选择列以减少内存开销。

总结：相比显式循环，此方法更符合 pandas 函数式编程范式，逻辑清晰、扩展性强，且一行核心代码即可完成多级结构构建，是生产环境中推荐的标准实践。

以上就是《Pandas转多级嵌套字典技巧》的详细内容，更多关于的资料请关注golang学习网公众号！