首页 > 文章 > python教程

Python字典展平方法：递归flatten实现

时间：2026-05-22 14:21:51 108浏览收藏

本文深入解析了Python中真正有效的嵌套字典展平方法，指出常见误区如依赖json.dumps或简单循环无法处理list元素、类型混淆及键名拼接无规则等问题，并提供了一个健壮的递归flatten函数——它统一支持dict与list混合嵌套，自动生成带索引路径的唯一键名（如a.b.0.c），同时兼顾None、空值、重复键、datetime等真实场景中的边界情况；文章还延伸讲解了展平后不可逆的本质、CSV/Pandas导出技巧、数据库字段适配、键名清洗必要性及性能优化建议，帮你避开生产环境中的典型陷阱，实现安全、可控、可落地的数据结构扁平化。

Python中如何将复杂字典结构展平为单层结构_使用flatten递归算法

为什么直接用 `json.dumps` 或循环遍历无法真正展平嵌套字典

很多人试过用 for 遍历字典再拼接键名，结果在遇到 list、None、嵌套 dict 混合结构时就崩了——比如 {"a": {"b": [1, {"c": 2}]}}，单纯递归一层就停，或把整个 list 当作值原样塞进去，根本没“展开”数组里的对象。

关键在于：展平不是只处理 dict，还要对 list 中的每个元素做同样递归，并为每个路径生成唯一键名（如 a.b.0.c）。

不处理 list → 数组内容被丢弃或整体保留，失去结构信息
不区分 None / int / str 类型 → 可能误触发递归或报错
键名拼接不用分隔符或固定规则 → 后续无法反向解析，也不利于写入 CSV/数据库

用 `flatten` 函数实现带路径控制的递归展平

Python 标准库没有内置 flatten，但可以用几行递归搞定。核心逻辑是：遇到 dict 就展开键值对；遇到 list 就按索引展开每个元素；其余类型（str、int、bool、None）直接作为叶子值返回。

示例函数：

def flatten(d, parent_key='', sep='.'):
    items = []
    for k, v in d.items() if isinstance(d, dict) else enumerate(d) if isinstance(d, list) else []:
        new_key = f"{parent_key}{sep}{k}" if parent_key else str(k)
        if isinstance(v, (dict, list)) and v:  # 非空才递归
            items.extend(flatten(v, new_key, sep=sep).items())
        else:
            items.append((new_key, v))
    return dict(items)

支持 dict 和 list 混合嵌套，如 {"x": [{"y": 1}, {"z": 2}]} → {"x.0.y": 1, "x.1.z": 2}
parent_key 初始为空，避免开头多出一个 .
用 isinstance(d, dict) 和 isinstance(d, list) 显式判断，不依赖鸭子类型，防止对字符串、bytes 等误展开

常见踩坑：空值、重复键、非标准数据类型怎么处理

真实数据里常有 None、datetime、自定义类实例，这些不会被默认递归，但可能让下游系统崩溃。

None：函数中已当作叶子值处理，但若需转成字符串 "null"，得在 else 分支加 if v is None: v = "null"
重复键名：比如 [{"id": 1}, {"id": 2}] 展平后都是 "0.id" 和 "1.id"，没问题；但若原始结构是 {"a": 1, "a": 2}（Python 字典本身不允许重复键），那就不是展平的问题，而是输入不合法
datetime、Decimal 等：它们不属于 (dict, list)，会直接存入结果，但某些 JSON 序列化器不认——建议在展平后统一用 json.dumps(..., default=str) 处理
无限嵌套（如自引用字典）：当前函数无保护，会栈溢出；加个深度计数参数或用 id(v) 缓存已访问对象可规避