登录
首页 >  文章 >  python教程

Python用struct读取二进制结构体详解

时间:2026-04-02 09:42:21 242浏览 收藏

Python中用struct模块读取二进制结构体时,数据解析错误的常见根源在于字节序未显式指定——C语言结构体默认采用本机小端序,而文件或网络协议往往严格规定为大端或小端;正确做法是先确认源数据的真实字节序,再在格式字符串开头明确添加'>'(大端)、'

Python怎么读取二进制结构体_struct模块pack与unpack解析

struct.unpack 读出来的数据对不上,是因为字节序没对齐

二进制结构体解析错位,十有八九是 struct.unpack 的格式字符串里字节序符漏了或写反了。C 语言 struct 默认按本机字节序(通常是小端),但网络协议、文件格式(如 BMP、PE)常固定用大端或小端。不显式声明,Python 就按 @(本机对齐 + 本机字节序)处理,容易和原始数据对不上。

实操建议:

  • 先确认源数据的字节序:查文档,或用十六进制工具看前几个字段的原始字节,比如 0x00000001 在内存中是 b'\x01\x00\x00\x00'(小端)还是 b'\x00\x00\x00\x01'(大端)
  • 格式字符串开头加明确符号:'(小端)、'>'(大端)、'!'(网络序,等价于大端);避免用默认的 @
  • 字段之间别留空格,'>I H' 是错的,得写成 '>IH';空格会被忽略,但易误读
  • struct.calcsize() 校验格式串长度是否匹配实际字节长度,比如 struct.calcsize('>IH') 返回 6,若传入 5 字节就会报 struct.error: unpack requires a buffer of 6 bytes

pack 后写入文件乱码,其实是没以二进制模式打开

struct.pack 返回的是 bytes,不是字符串。如果用文本模式('w')写入,Python 会尝试编码转换,轻则报 UnicodeEncodeError,重则静默损坏二进制内容。

实操建议:

  • 写入必须用 'wb' 模式:open('out.bin', 'wb').write(struct.pack('>I', 123))
  • 读取对应用 'rb' 模式,否则 read() 返回 str,传给 unpack 直接抛 TypeError: a bytes-like object is required, not 'str'
  • 别用 print() 直接输出 pack 结果——它显示的是转义后的 bytes 表示(如 b'\x00\x00\x00{'),不是“乱码”,只是不可见字符多

结构体里有字符串字段,不能直接用 s 格式符硬套

C 风格 struct 中的字符串通常是定长字节数组(如 char name[32]),而 Python 的 's' 格式符只负责按字节读/写,不做编码解码。如果你存的是 UTF-8 字符串,unpack 出来仍是 bytes,需手动 .decode('utf-8');如果含 C 风格 null 终止符(\x00),还得切片截断。

实操建议:

  • '32s' 读出 32 字节,再用 .rstrip(b'\x00').decode('utf-8') 安全转字符串
  • 写入前确保字节长度 ≤ 字段容量:用 name.encode('utf-8')[:31] + b'\x00' 填充,避免溢出破坏后续字段
  • 别用 'p'(Pascal 字符串)除非你确定数据来源真用这格式——它前 1 字节存长度,兼容性差,几乎没人用

嵌套结构体或变长字段,struct 模块本身不支持

struct 只能处理编译期已知长度的平铺结构。遇到联合体(union)、指针、动态数组(如末尾跟一个长度字段 + 实际数据),它无能为力。

实操建议:

  • 拆成多步 unpack:先读头部固定部分(含长度字段),再根据该值算出偏移,用切片取出后续数据,单独 unpack
  • 例如协议头是 '>I I'(魔数 + 数据长度),读完后用 data[8:8+length] 提取负载
  • 真要频繁处理复杂二进制格式,别硬刚 struct,换 construct 库(声明式定义)或手写 io.BytesIO + 逐字段解析,更稳

最常被忽略的一点:struct 对齐('x' 填充字节、'0c' 等)在跨平台时极易出问题。C 编译器可能因 #pragma pack 改变对齐方式,而 Python 的 struct 默认按自然对齐(@)。只要格式字符串里出现 'x' 或字段间有空隙,务必确认 C 端实际内存布局,别只看 struct 定义。

文中关于的知识介绍,希望对你的学习有所帮助!若是受益匪浅,那就动动鼠标收藏这篇《Python用struct读取二进制结构体详解》文章吧,也可关注golang学习网公众号了解相关技术文章。

资料下载
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>