首页 > 文章 > python教程

Pythonbytearray详解：可变字节操作全解析

时间：2026-04-10 20:21:49 423浏览收藏

Python 的 `bytearray` 是一种可变的字节序列，与不可变的 `bytes` 形成关键互补——它支持原地修改单个字节、切片替换、动态伸缩等操作，特别适用于协议解析、二进制补丁、加密中间态处理等高频改写场景；但其使用充满隐性陷阱：构造必须显式编码、赋值需整数而非字符、混合运算易意外升格为 `bytes`、与 `memoryview` 配合虽可实现零拷贝高性能操作却需警惕内存生命周期，加之性能差异、跨版本兼容性和第三方库兼容风险，让看似简单的字节操作暗藏诸多“反直觉”细节——掌握这些，才能真正安全高效地驾驭底层字节世界。

Python bytearray怎么用_可变字节序列与内存视图操作

bytearray 是什么，和 bytes 有什么区别

它就是可变的 bytes。你不能改 bytes 里的单个字节，但能改 bytearray——比如 b[0] = 65 合法，bb[0] = 65（其中 bb 是 bytes）直接报 TypeError: 'bytes' object does not support item assignment。

底层共享同一套字节存储逻辑，但 bytearray 允许原地修改，不用每次操作都新建对象。适合做协议解析、二进制 patch、加密中间态等需要频繁改写字节的场景。

常见错误现象：

误以为 bytearray(b'hello') + b'world' 返回 bytearray → 实际返回 bytes，因为 + 操作符右侧是 bytes，Python 默认升格为不可变类型
把 bytearray 当成 list 处理，调用 .append() 传入字符串如 b.append('x') → 报 TypeError: an integer is required，必须传 int（0–255）或单字节 bytes

怎么安全地构造和修改 bytearray

构造时别依赖隐式编码：直接写 bytearray(b'\x00\x01') 最稳；用字符串要显式指定编码，比如 bytearray('中文', 'utf-8')。不写编码会触发 UnicodeEncodeError（默认用系统 locale，极不可靠）。

修改要点：

b[i] = x：x 必须是 0–255 的整数，不是字符
b[i:j] = iterable：右边可以是 bytes、bytearray、list（元素必须全为 int）、甚至 memoryview
追加单字节用 .append(65)，追加多字节用 .extend(b'xyz')，别混用 .append(b'x')
切片赋值长度不匹配也没问题：b[1:3] = b'\xff' 会自动收缩；b[1:2] = b'\x00\x01\x02' 会自动扩张

示例：

data = bytearray(b'\x00\x01\x02\x03')
data[1] = 0xff           # ✅ OK
data[2:3] = b'\xaa\xbb'  # ✅ 自动扩展一位
data.append(0xcc)        # ✅
# data.append('c')       # ❌ TypeError

和 memoryview 配合读写大块内存

memoryview 不复制数据，直接映射 bytearray 底层缓冲区，适合零拷贝处理图像帧、网络包 payload、大文件分段写入等场景。

关键点：

m = memoryview(bytearray(1024)) 创建后，m[0] = 1 会实时反映到原 bytearray 上
对 memoryview 切片（如 m[100:200]）仍是 view，不分配新内存
但一旦调用 .tobytes() 或 .tolist() 就触发拷贝，失去零拷贝意义
bytearray 被 gc 回收后，关联的 memoryview 变成只读且无法访问数据（抛 ValueError: memoryview has been detached）

典型误用：

b = bytearray(10)
m = memoryview(b)
del b  # 原 bytearray 没了
print(m[0])  # ValueError

性能与兼容性要注意的几个点

bytearray 在 CPython 中实现高效，但某些操作比 bytes 慢：比如 in 查找、.find()、.count() —— 因为内部没做不可变性优化，每次都要检查缓冲区是否被外部修改过（虽然实际极少发生）。

跨版本注意：

Python 2 没有 bytearray（只有 str 承担字节角色），所有代码必须 Python 3+
bytearray 支持 .decode()，但失败时抛 UnicodeDecodeError，不像 bytes.decode(errors='ignore') 那样可配置；想容错得先转 bytes 再 decode
写入文件时，open(..., 'wb').write(b) 完全支持 bytearray，无需转 bytes；但某些 C 扩展（如旧版 Pillow）可能只认 bytes，需显式调用 bytes(b)

真正容易被忽略的是：当你把 bytearray 传给第三方库函数时，它可能悄悄调用 bytes() 构造副本，或者在内部缓存了原始指针——这时候你后续修改原 bytearray，对方看到的数据就可能不一致。

今天带大家了解了的相关知识，希望对你有所帮助；关于文章的技术知识我们会一点点深入介绍，欢迎大家关注golang学习网公众号，一起学习编程~