WebSocket传回来的数据是乱码 WebSocket编码格式设置方法【详解】
时间:2026-05-24 18:21:20 254浏览 收藏
今天golang学习网给大家带来了《WebSocket传回来的数据是乱码 WebSocket编码格式设置方法【详解】》,其中涉及到的知识点包括等等,无论你是小白还是老手,都适合看一看哦~有好的建议也欢迎大家在评论留言,若是看完有所收获,也希望大家能多多点赞支持呀!一起加油学习~
乱码本质是UTF-8编码处理缺失,非协议问题;PHP需确认源编码后转UTF-8并校验,Python须显式指定文件/输入编码,Java应URL编码查询参数并避免容器默认ISO解码,全链路需统一UTF-8。
乱码不是 WebSocket 协议本身的问题,而是你接收或发送的数据字节流没按 UTF-8 编码规范处理。协议强制要求所有文本帧 payload 必须是合法 UTF-8 字节序列,任何非 UTF-8 字符串(比如 GBK、ISO-8859-1 或带 BOM 的文件)都会导致服务端解析失败或客户端显示为“”“锟斤拷”。
PHP 客户端发中文前必须调用 utf8_encode() 吗
不一定,而且多数情况下不该用。utf8_encode() 只接受 ISO-8859-1 编码输入,对 GBK/GB2312 字符串会直接错乱。真正该做的是:
- 确认源字符串真实编码:来自数据库?表单 POST?JSON 接口?用
mb_detect_encoding($str)粗略判断,但别依赖它 - 统一转成 UTF-8:
mb_convert_encoding($str, 'UTF-8', 'GBK')(适用于 GBK 源)、iconv('GB2312', 'UTF-8//IGNORE', $str)(兼容性稍好) - 发送前校验:
mb_check_encoding($str, 'UTF-8')返回false就别发,否则服务端大概率断连 - 如果用
json_encode()包装数据,务必加JSON_UNESCAPED_UNICODE标志,否则中文变\u4f60,虽合法但增大体积且部分弱实现服务端会拒收
Python websocket-client 收到中文显示为乱码
常见于 Windows 环境下读取本地配置、日志或用户输入后直接 send,而 Python 默认使用系统编码(如 cp936/GBK)。关键点不在 WebSocket 库,而在你传给 ws.send() 的那个字符串本身:
- 检查变量来源:如果是
open('xxx.txt').read(),必须显式指定 encoding='utf-8',否则默认用 locale.getpreferredencoding() - 如果是终端输入(
input()),在 Windows 上可能已是 GBK 编码,需先解码再转 UTF-8:text.encode('gbk').decode('utf-8')(仅当确定源是 GBK 时) - 接收端无需额外解码:WebSocket 协议层已保证是 UTF-8 字节流,
ws.recv()返回的就是 Python str(Unicode),直接用即可 - 若收到的是
bytes类型(比如用了recv_data()),用data.decode('utf-8'),但先确认没 BOM:data.lstrip(b'\xef\xbb\xbf').decode('utf-8')
Java @OnMessage 方法里中文变成“???”
这是典型的字符集透传错误——HTTP 握手阶段无编码可设,但 Tomcat/Jetty 在解析 URL 查询参数或 HTTP 头时可能用错了默认编码。问题常出在连接 URL 的 query string 里传中文(如 ws://host/path?name=张三):
- URL 中文必须先
URLEncoder.encode(name, "UTF-8"),服务端再用URLDecoder.decode(qs, "UTF-8")解析 - 不要依赖容器自动 decode;Tomcat 8+ 默认用
ISO-8859-1解 query string,所以你在@OnOpen里拿到的session.getQueryString()是乱码,必须手动解 - WebSocket 消息体(即
@OnMessage收到的String)本身是 UTF-8 解码后的 Unicode,正常不会乱;如果乱,说明前端发的就不是 UTF-8,或者中间有代理篡改了二进制流 - 检查是否启用了 Nginx 反向代理:某些旧版 Nginx 配置会 strip websocket headers 或 buffer 多帧,间接导致帧头错位,表现为“部分乱码+截断”
最易被忽略的一点:乱码经常不是单一环节出错,而是“源头编码→传输路径→服务端解析→日志打印→前端渲染”整条链路中某一处偷偷做了隐式转换。建议从服务端接收到的原始字节开始查起,用 hexdump 或 bindec(ord($b[0])) 看首字节是不是 0xEF(UTF-8 BOM 开头),再逐段比对,而不是一上来就改 WebSocket 库配置。
今天带大家了解了的相关知识,希望对你有所帮助;关于文章的技术知识我们会一点点深入介绍,欢迎大家关注golang学习网公众号,一起学习编程~
-
502 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
184 收藏
-
413 收藏
-
149 收藏
-
346 收藏
-
213 收藏
-
276 收藏
-
322 收藏
-
485 收藏
-
107 收藏
-
258 收藏
-
271 收藏
-
490 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 485次学习