Python处理嵌套JSON数据技巧
时间:2025-12-26 11:27:49 179浏览 收藏
学习知识要善于思考,思考,再思考!今天golang学习网小编就给大家带来《Python处理JSON嵌套数据方法详解》,以下内容主要包含等知识点,如果你正在学习或准备学习文章,就都不要错过本文啦~让我们一起来看看吧,能帮助到你就更好了!
推荐用 dict.get() 链式调用并设合理默认值(如{}或[])安全访问嵌套JSON;深度大时封装 safe_get 或用 jsonpath-ng 提取;结构化数据转 DataFrame 用 pd.json_normalize();统一清洗 None/""/"null" 等空值。

遇到 KeyError 说明没处理好嵌套层级
JSON 数据里经常有 data → list → [0] → user → profile 这种多层嵌套,直接写 res['data']['list'][0]['user']['profile']['name'] 很容易在某一层为空或缺失字段时抛 KeyError 或 TypeError。
推荐用 dict.get() 链式调用,配合默认值兜底:
name = (
res
.get('data', {})
.get('list', [{}])[0]
.get('user', {})
.get('profile', {})
.get('name', '未知')
)- 每层都用
.get(key, default),避免崩;default选空字典或空列表,方便后续继续链式调用 [0]这种索引操作不能用get,得先确保列表存在且非空——所以前面要用.get('list', [{}])提供安全兜底- 如果结构深度大、访问频繁,建议封装成函数,比如
safe_get(res, 'data.list.0.user.profile.name', '未知')
用 jsonpath-ng 解析深层嵌套更灵活
当嵌套结构不固定(比如 items 下可能有 product 或 service 两种类型),或者要批量提取同名字段(如所有 id),硬写 .get() 会很累。
jsonpath-ng 是 Python 里最接近 JavaScript 的 lodash.get + jq 的组合:
from jsonpath_ng import parse
from jsonpath_ng.ext import parse as ext_parse
from jsonpath_ng.jsonpath import DatumInContext
<h1>安装:pip install jsonpath-ng</h1><p>json_data = {"results": [{"id": 1, "tags": ["a", "b"]}, {"id": 2, "tags": ["c"]}]}
jsonpath_expr = ext_parse('$.results[*].id')
matches = [match.value for match in jsonpath_expr.find(json_data)]</p><h1>→ [1, 2]</h1>$.results[*].id可以跳过中间层数,直接取所有id;[*]自动处理列表,不用手动写[0]、[1]- 支持过滤:
$.results[?(@.tags.length > 1)]找出tags长度大于 1 的项 - 注意:原生
jsonpath-ng不支持..(递归下降),要用ext_parse;但也不支持filter里的复杂表达式,比如@.x == @.y会报错
把嵌套 JSON 扁平化成 pandas DataFrame
接口返回的是树状结构,但你真正要分析的是“每个用户对应几个订单”,这种一对多关系直接转 pd.DataFrame 会出错——pandas 会把整个子对象塞进一个单元格。
正确做法是先用 pd.json_normalize() 拆解:
import pandas as pd
<p>data = {
"users": [
{
"id": 1,
"name": "Alice",
"orders": [{"oid": "A001", "amount": 99}, {"oid": "A002", "amount": 150}]
},
{
"id": 2,
"name": "Bob",
"orders": [{"oid": "B001", "amount": 78}]
}
]
}</p><h1>展开 users,同时把 orders 拆成多行(record_path)</h1><p>df = pd.json_normalize(
data['users'],
record_path='orders',
meta=['id', 'name'],
errors='ignore'
)</p><h1>→ 三行:Alice 两条订单,Bob 一条</h1>record_path指定要“炸开”的嵌套列表字段;meta指定要保留的父级字段- 如果
orders缺失,加errors='ignore'防止中断;也可以用meta_prefix给父级字段加前缀避免重名 - 不支持多层嵌套展开(比如
orders.items.discount),得先用jsonpath-ng或递归预处理
None 和空字符串混用导致数据清洗失败
很多接口对“无值”字段返回 null(Python 里是 None),但有些又返回空字符串 ""、空列表 [],甚至 "null" 字符串。不做统一清理,后续 str.upper() 或 len() 就会报错。
- 别用
if not x:判断是否为空——它会把0、False也当成空,而这些可能是合法值 - 明确检查类型:
x is None、isinstance(x, str) and not x.strip()、isinstance(x, list) and not x - 建议在解析后立刻做一次清洗,例如写个
clean_value(v)函数,把None、""、"null"都转成统一的None,再交给下游逻辑
嵌套深不可怕,可怕的是每一层都靠运气判断是否存在。真正省时间的做法,不是写更多 try/except,而是从第一行解析开始就建立“防御性访问”习惯——尤其是 .get() 的默认值选什么,决定了后面要不要写十行校验代码。
文中关于的知识介绍,希望对你的学习有所帮助!若是受益匪浅,那就动动鼠标收藏这篇《Python处理嵌套JSON数据技巧》文章吧,也可关注golang学习网公众号了解相关技术文章。
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
340 收藏
-
171 收藏
-
481 收藏
-
438 收藏
-
408 收藏
-
127 收藏
-
475 收藏
-
236 收藏
-
364 收藏
-
260 收藏
-
190 收藏
-
250 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 485次学习