Python解析JSON数据技巧:json模块进阶
时间:2026-05-20 10:49:25 302浏览 收藏
Python的json模块远不止基础的loads()和dumps()——掌握其进阶技巧,能让你在真实开发中安全、高效、灵活地处理JSON数据:通过自定义default函数实现类实例的无缝序列化,利用object_hook精准还原为对象;用ensure_ascii=False保留中文可读性,配合显式UTF-8编码避免文件读写乱码;更关键的是,通过parse_float/parse_int等参数加固解析过程,防范恶意JSON引发的安全与性能风险,彻底告别eval系危险操作。

Python的json模块不只是loads()和dumps()这么简单——掌握进阶用法,能帮你更稳、更快、更灵活地处理真实场景中的JSON数据。
自定义对象序列化:让类实例变JSON
默认情况下,json.dumps()无法直接处理自定义类实例,会报TypeError: Object of type XXX is not JSON serializable。解决方法是提供default参数,告诉JSON编码器“遇到不认识的类型时怎么转”:
示例:将Person类转为JSON
import json
<p>class Person:
def <strong>init</strong>(self, name, age):
self.name = name
self.age = age</p><p>def person_to_dict(obj):
if isinstance(obj, Person):
return {'name': obj.name, 'age': obj.age}
raise TypeError(f"Object of type {type(obj).<strong>name</strong>} is not JSON serializable")</p><p>data = Person("Alice", 30)
json_str = json.dumps(data, default=person_to_dict, indent=2)
print(json_str)</p><h1>输出:</h1><h1>{</h1><h1>"name": "Alice",</h1><h1>"age": 30</h1><h1>}</h1><p></p>反序列化时还原对象:从JSON重建实例
json.loads()默认只返回字典或列表,若想还原成具体类对象,可用object_hook参数——它会在每个JSON对象(即每个dict)解析完成后被调用:
- 定义一个函数,接收解析后的
dict,判断是否应构造某类实例 - 返回原始
dict(不做处理)或返回新创建的对象
示例:把含"type"字段的JSON自动转为对应类实例
def dict_to_obj(d):
if d.get("type") == "person":
return Person(d["name"], d["age"])
return d # 其他情况保持原样
<p>json_data = '{"type": "person", "name": "Bob", "age": 25}'
obj = json.loads(json_data, object_hook=dict_to_obj)
print(type(obj), obj.name) # <class '<strong>main</strong>.Person'> Bob
</p>处理中文、特殊字符与编码细节
默认json.dumps()会把非ASCII字符(如中文)转义为\uXXXX格式,影响可读性。用ensure_ascii=False即可保留原文:
json.dumps(data, ensure_ascii=False)→ 输出中文而非\u4f60\u597d- 写入文件时,务必显式指定
encoding='utf-8',避免平台默认编码出错 - 读取文件时也建议用
open(..., encoding='utf-8')打开,再传给json.load()
另外,sort_keys=True能让键名有序输出,便于比对;indent=2提升可读性,调试时很实用。
安全解析不可信JSON:避免执行危险操作
来自外部(如API、用户上传)的JSON可能含恶意结构(例如超深嵌套、超大数组),导致内存溢出或拒绝服务。标准json模块不带限流机制,但可通过以下方式加固:
- 用
json.loads(s, parse_float=str, parse_int=str)防止数字过大引发精度丢失或异常 - 结合
sys.setrecursionlimit()限制嵌套深度(需谨慎,影响全局) - 更稳妥的做法:先用
json.scanner.make_scanner()手动扫描,或改用第三方库如ijson流式解析大文件 - 永远不要用
eval()或ast.literal_eval()代替json.loads()——它们不校验JSON语法,有代码注入风险
今天关于《Python解析JSON数据技巧:json模块进阶》的内容就介绍到这里了,是不是学起来一目了然!想要了解更多关于的内容请关注golang学习网公众号!
相关阅读
更多>
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
最新阅读
更多>
-
234 收藏
-
490 收藏
-
302 收藏
-
280 收藏
-
279 收藏
-
205 收藏
-
136 收藏
-
358 收藏
-
171 收藏
-
451 收藏
-
124 收藏
-
491 收藏
课程推荐
更多>
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 485次学习