首页 > 文章 > python教程

JSON序列化自定义：set/frozenset/bytes处理方法

时间：2026-01-30 08:45:43 181浏览收藏

“纵有疾风来，人生不言弃”，这句话送给正在学习文章的朋友们，也希望在阅读本文《你可以通过自定义 json.dumps() 的 default 参数来实现对 set、frozenset 和 bytes 类型的序列化。下面是一个示例，展示如何将这些类型转换为 JSON 兼容的格式（如列表或字符串）。示例代码：import json def default_serializer(obj): if isinstance(obj, set): return list(obj) elif isinstance(obj, frozenset): return list(obj) elif isinstance(obj, bytes): return obj.decode('utf-8') else: raise TypeError(f"Type {type(obj)} not serializable") data = { "set": {1, 2, 3}, "frozenset": frozenset([4, 5, 6]), "bytes": b"hello" } json_str = json.dumps(data, default=default_serializer) print(json_str)输出结果：{"set": [1, 2, 3], "frozenset": [4, 5, 6], "bytes": "hello"}说明：default_serializer 是一个函数，用于处理无法直接序列化的对象。如果你希望保留更多原始数据信息，也可以返回字典形式，例如：{'type': 'set', 'value': list(obj)}。使用 `json.dumps(..., default》后，能够真的帮助到大家。我也会在后续的文章中，陆续更新文章相关的技术文章，有好的建议欢迎大家在评论留言，非常感谢！

json.dumps()默认不支持set/frozenset/bytes，需通过default参数或自定义JSONEncoder处理：set/frozenset转list，bytes用base64编码或UTF-8解码，且须确保嵌套元素本身可序列化。

json.dumps() 如何自定义序列化 set / frozenset / bytes

json.dumps() 默认不支持 set / frozenset / bytes 怎么办

直接调用 json.dumps() 序列化含 set、frozenset 或 bytes 的对象会抛出 TypeError: Object of type set is not JSON serializable。这不是 bug，而是 JSON 标准本身不定义这些类型——Python 的 json 模块严格遵循该限制，不会自动降级或猜测意图。

用 default 参数把不可序列化对象转成 dict/list/str

default 是最常用也最可控的方式：它接收一个函数，当遇到无法序列化的对象时，由你决定返回什么合法的 JSON 类型（如 list、str、dict）。

典型做法：

set 和 frozenset → 转为 list（保持元素可序列化前提下）
bytes → 先用 .decode('utf-8')（若确定是 UTF-8），或用 base64.b64encode(x).decode('ascii') 保全二进制语义
其他未知类型建议抛出原异常，避免静默错误

示例：

import json
import base64
def json_fallback(obj):
if isinstance(obj, (set, frozenset)):
return list(obj)
elif isinstance(obj, bytes):
return base64.b64encode(obj).decode('ascii')
raise TypeError(f"Object of type {type(obj).name} is not JSON serializable")
data = {"tags": {"python", "web"}, "payload": b"\x00\x01\xff"}
json.dumps(data, default=json_fallback)
→ '{"tags": ["python", "web"], "payload": "AAH/" }'

注意 bytes 编码方式选择：decode vs base64

对 bytes 处理要分场景：

若明确是文本（如 UTF-8 编码的字符串），用 obj.decode('utf-8') 更简洁可读
若可能是任意二进制数据（如加密密钥、图片片段），必须用 base64，否则会因非法字节抛 UnicodeDecodeError
别用 str(obj) 或 obj.hex() —— 前者生成类似 b'\\x00' 的字符串，后者长度翻倍且不易反解

自定义 JSONEncoder 子类适合复用或组合逻辑

当项目中多处需要一致的序列化规则，或者要同时处理多种自定义类型（如 datetime + set），继承 json.JSONEncoder 更清晰：

class CustomEncoder(json.JSONEncoder):
    def default(self, obj):
        if isinstance(obj, (set, frozenset)):
            return sorted(obj)  # 可选：排序让输出稳定
        elif isinstance(obj, bytes):
            return base64.b64encode(obj).decode('ascii')
        return super().default(obj)
json.dumps(data, cls=CustomEncoder)

注意：default 函数和 cls 不能共存；优先用 cls 可以复用、可继承、便于单元测试。

真正容易被忽略的是：无论用哪种方式，都得确保 set 里的每个元素本身可被 JSON 序列化——比如 {1, {"a": 2}} 会失败，因为 dict 不能直接放进 set 再靠 fallback 处理；这种嵌套需提前规整或改用其他结构。

以上就是《JSON序列化自定义：set/frozenset/bytes处理方法》的详细内容，更多关于的资料请关注golang学习网公众号！