登录
首页 >  文章 >  python教程

Python快速存字典为JSON及中文处理

时间:2026-05-07 14:30:58 140浏览 收藏

本文深入解析了Python中使用json.dump保存字典为JSON文件的核心技巧与常见陷阱,重点解决了中文乱码问题(必须同时设置ensure_ascii=False和encoding="utf-8"),对比了json.dump与json.dumps+write的性能与适用场景,详解了如何通过default参数优雅处理datetime、set等非标准类型,并提醒了尾部逗号、控制字符及换行符等影响跨平台兼容性的关键细节,辅以可直接复用的代码示例和实战建议,助你一次写出规范、可读、健壮且广泛兼容的JSON文件。

Python怎么将字典数据快速保存为JSON文件_使用json.dump方法并处理中文编码

json.dump 保存字典时中文变乱码?关键是 ensure_ascii=False

默认情况下 json.dump 会把非 ASCII 字符(比如中文)转成 Unicode 转义序列,如 "\u4f60\u597d",而不是直接写入 UTF-8 字符。这不是 bug,是设计行为——但多数人要的是可读的中文文件。

解决方法很简单:显式传入 ensure_ascii=False,并确保文件以 UTF-8 打开:

import json

data = {"name": "张三", "city": "上海"}
with open("output.json", "w", encoding="utf-8") as f:
    json.dump(data, f, ensure_ascii=False, indent=2)
  • encoding="utf-8" 必须和 ensure_ascii=False 配合使用,缺一不可
  • indent=2 不是必须的,但加了更易读;不加则输出为单行
  • 如果漏掉 encoding="utf-8",在 Windows 上可能报 UnicodeEncodeError

用 json.dump 还是 json.dumps + write?性能和内存怎么选

两种写法都能实现,但适用场景不同:

  • 直接用 json.dump(data, f, ...):数据一次性写入文件,内存占用低,适合大字典(比如上万条记录)
  • json.dumps(data, ...) 得到字符串,再 f.write(...):方便中间处理(如拼接前缀、加注释),但会把整个 JSON 字符串加载进内存,字典大时容易 OOM

除非有特殊需求,优先用 json.dump。注意不要混用:json.dump 接文件对象,json.dumps 返回字符串——类型错会导致 TypeError: expected str, bytes or os.PathLike object

字典含 datetime、set 或自定义对象时 json.dump 直接报错

json.dump 只认基本类型(dictliststrintfloatboolNone)。遇到 datetimesetbytes 或自定义类实例,会抛 TypeError: Object of type ... is not JSON serializable

解决方式是提供 default 参数:

import json
from datetime import datetime

data = {"ts": datetime.now(), "tags": {"python", "json"}}

def json_fallback(obj):
    if isinstance(obj, datetime):
        return obj.isoformat()
    elif isinstance(obj, set):
        return list(obj)
    raise TypeError(f"Object of type {type(obj).__name__} is not JSON serializable")

with open("output.json", "w", encoding="utf-8") as f:
    json.dump(data, f, ensure_ascii=False, default=json_fallback)
  • 别用 str(obj) 当 fallback——虽然不报错,但语义丢失严重(比如 datetime 变成 "2024-05-12 14:23:00.123456",无法被标准 JSON 解析器还原)
  • 如果项目中多次用到,建议封装一个复用的 default 函数,或继承 json.JSONEncoder

保存后用其他程序读不了?检查换行符和尾部逗号

JSON 标准不支持尾部逗号(trailing comma)和控制字符(如 \x00),但 Python 的 json 模块默认允许写入(尤其在 indent 模式下)。某些严格解析器(如前端 JSON.parse、部分嵌入式 JSON 库)会因此失败。

  • 避免手动在字典里写 "key": "value", ——Python 允许,JSON 不允许
  • 不用 indent 时,json.dump 不会加多余空白;但用了 indent 后,确保目标环境支持带缩进的 JSON(绝大多数现代工具都支持)
  • 如果文件用于跨平台传输,确认换行符是 \n(Unix 风格);Windows 下用 open(..., newline="") 防止额外插入 \r

最稳妥的做法:保存后用 json.load(open("output.json")) 在 Python 里反向验证一次,能成功加载就基本兼容。

到这里,我们也就讲完了《Python快速存字典为JSON及中文处理》的内容了。个人认为,基础知识的学习和巩固,是为了更好的将其运用到项目中,欢迎关注golang学习网公众号,带你了解更多关于的知识点!

资料下载
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>