登录
首页 >  文章 >  python教程

Python中文乱码解决方法大全

时间:2026-02-14 10:13:39 302浏览 收藏

Python处理中文乱码的本质不是事后修复,而是从源头统一编码规范:在源文件首行显式声明`# -*- coding: utf-8 -*-`确保解释器正确读取中文,文件读写时务必通过`encoding='utf-8'`(或按实际编码如`gbk`)显式指定编码参数,同时将终端、IDE控制台及数据库连接等运行环境全部配置为UTF-8模式;面对requests、MySQL等外部数据,需依据其真实编码信息合理解码,而非盲目调用decode——掌握这一体系化编码治理思路,才能彻底告别乱码困扰,让中文在Python项目中稳定、可靠、跨平台地自由流动。

python如何解决中文乱码问题

Python处理中文乱码,核心在于统一编码格式、明确声明源码编码、正确设置文件读写编码。关键不是“修复乱码”,而是从源头避免编码不一致。

源文件开头加编码声明

Python 2 默认 ASCII,Python 3 默认 UTF-8,但显式声明更稳妥,尤其涉及中文注释或字符串字面量时:

  • 在 .py 文件第一行或第二行添加:# -*- coding: utf-8 -*-
  • 该声明仅影响 Python 解释器如何读取源码本身,不影响运行时数据流
  • 若用其他编码(如 GBK),需对应修改声明,但强烈建议全程使用 UTF-8

文件读写时指定 encoding 参数

open() 函数默认编码依赖系统 locale,极易出错。必须显式传入 encoding:

  • 读取中文文本:with open('data.txt', 'r', encoding='utf-8') as f:
  • 写入中文文本:with open('out.txt', 'w', encoding='utf-8') as f:
  • 若文件是 GBK 编码(如 Windows 记事本旧默认),改用 encoding='gbk',但应优先转为 UTF-8 存储
  • 避免不带 encoding 的 open(),尤其在跨平台或读第三方文件时

终端/控制台输出中文正常显示

即使代码和文件没问题,终端本身不支持 UTF-8 也会显示为 或空格:

  • Windows CMD:执行 chcp 65001 切换到 UTF-8 模式(临时生效)
  • Windows PowerShell / VS Code 终端:通常默认支持 UTF-8,可检查 $OutputEncoding 是否为 UTF8Encoding
  • macOS / Linux 终端:一般默认 UTF-8,可通过 locale | grep UTF 确认
  • IDE 内置终端(如 PyCharm):在设置中搜索 “file encoding” 和 “console encoding”,确保均为 UTF-8

处理 requests 或数据库返回的中文

外部数据源常自带编码信息,不能盲目 decode:

  • requests.get():响应体默认按 headers 中的 charset 解码,但有时不准。可手动指定:r.content.decode('utf-8')r.text(已解码)
  • MySQLdb / pymysql:连接时加上 charset='utf8mb4',并确保表字符集为 utf8mb4_unicode_ci
  • SQLite:默认支持 UTF-8,无需额外设置,但插入前确保字符串是 str 类型(非 bytes)

理论要掌握,实操不能落!以上关于《Python中文乱码解决方法大全》的详细介绍,大家都掌握了吧!如果想要继续提升自己的能力,那么就来关注golang学习网公众号吧!

资料下载
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>