登录
首页 >  文章 >  python教程

Python对象序列化:pickle与json对比解析

时间:2026-05-06 21:58:57 415浏览 收藏

Python的pickle与json虽同为序列化工具,却在功能、兼容性、安全性和性能上存在根本差异:pickle能深度序列化任意Python对象(包括函数、类实例和循环引用),速度快、体积小,但完全绑定Python生态、反序列化即执行任意代码,极度危险;而json仅支持基础数据类型,需手动转换复杂对象,性能稍逊且生成文本体积更大,却具备跨语言通用性、人类可读性与天然安全性。因此,对外交互或处理不可信数据时必须用json,仅在可信Python环境内传递复杂对象时才谨慎选用pickle——选错不仅影响效率,更可能引发严重安全风险。

Python序列化对象_pickle与json对比分析

Python 中 picklejson 都能实现对象序列化,但适用场景、能力边界和安全特性差异极大,不能简单互换。

功能覆盖:pickle 支持任意 Python 对象,json 只支持基础数据类型

pickle 是 Python 原生序列化协议,能处理函数、类实例、嵌套自定义对象、带循环引用的结构等。例如:

  • 序列化一个包含方法、属性和内部状态的类实例(如 datetime.datetime.now()
  • 保存带有闭包的 lambda 函数(虽不推荐,但技术上可行)
  • 正确处理对象间相互引用(A 持有 B,B 也持有 A)

json 仅支持 dictliststrintfloatboolNone 这六种类型。遇到 datetimeset、自定义类等会直接报错 TypeError,需手动转换(如用 default 参数预处理)。

跨语言与兼容性:json 天然通用,pickle 完全绑定 Python

json 是标准文本格式,所有主流语言都有成熟解析器,适合 API 通信、配置文件、前端交互等场景。生成的字符串可读、可调试、可版本控制。

pickle 是二进制(或 ASCII 兼容文本)格式,且协议版本随 Python 升级变化(如 protocol 4 在 3.4+ 引入,3.7+ 默认用 protocol 4)。用高版本 pickle 序列化的数据,在低版本 Python 中可能无法反序列化;更严重的是,其他语言基本无法解析 pickle 流。

安全性:pickle 反序列化 = 执行任意代码,json 相对安全

pickle.load()pickle.loads() 在反序列化时会动态调用类构造器、__setstate__ 等,攻击者可构造恶意 payload 实现远程代码执行(RCE)。因此绝不能反序列化不可信来源的 pickle 数据

json.loads() 本质是解析纯数据结构,不触发用户定义逻辑,不存在代码执行风险。即使输入恶意 JSON(如超深嵌套、超大数字),最多引发内存溢出或解析失败,不会导致任意命令执行。

性能与体积:pickle 通常更快更紧凑,json 更慢但更透明

在纯 Python 对象场景下,pickle(尤其用 protocol=45)序列化/反序列化速度一般比 json 快 2–5 倍,生成的字节流也更小(尤其含大量重复结构或二进制数据时)。

json 因需类型转换(如 datetime → str)、文本编码/解码、严格语法检查,开销更大。但它生成的是人类可读文本,便于日志记录、人工校验、Git diff 对比。

选型原则很明确:需要跨语言或处理外部输入,选 json;只在可信 Python 环境内做临时存储或进程间传递,且对象复杂,再考虑 pickle。不复杂但容易忽略。

终于介绍完啦!小伙伴们,这篇关于《Python对象序列化:pickle与json对比解析》的介绍应该让你收获多多了吧!欢迎大家收藏或分享给更多需要学习的朋友吧~golang学习网公众号也会发布文章相关知识,快来关注吧!

资料下载
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>