登录
首页 >  文章 >  python教程

Bytearray与Bytes性能对比解析

时间:2026-04-16 19:08:38 189浏览 收藏

本文深入剖析了bytearray与bytes在Python中的性能差异与适用边界:bytearray仅在频繁原地修改场景下胜出,因其可变性避免重复内存分配,但单次构造或纯读取时bytes凭借C层深度优化反而更快;真正零拷贝的关键在于memoryview的配合使用,而非单纯依赖bytearray;I/O操作中二者实际性能几乎无差,决定性因素是缓冲策略与系统调用效率;同时必须警惕bytearray的大内存驻留、GC压力、线程不安全及序列化开销等隐性成本——实践中,唯有结合修改频率、生命周期管理与C API交互需求,采用memoryview+小块bytearray+显式清理的组合方案,才能在真实压测中实现最优性能。

Python中Bytearray比Bytes快吗_可变字节序列的内存读写优化

Bytearray的写入性能确实比Bytes高,但只在频繁修改时成立

因为bytes是不可变对象,每次切片、拼接或替换都会生成新对象,触发内存分配和拷贝;而bytearray是可变对象,原地修改不产生新对象。但这个优势仅在「多次写入」场景下体现——如果只是读取或单次构造,bytes反而更快(C层优化更彻底,且无额外可变性开销)。

常见错误现象:TypeError: 'bytes' object does not support item assignment,试图直接改bytes[i]时抛出,这时才真正需要切换到bytearray

  • 适用场景:协议解析中逐字节填充缓冲区、加密算法中的状态数组、网络包组装
  • 不适用场景:HTTP响应体读取、文件哈希计算(只读)、JSON二进制编码输出
  • 构造开销:bytearray(b'abc')bytes(b'abc') 多约15%初始化时间,但后续10次以上[i] = x操作就能抹平

memoryview绕过复制,才是真正的零拷贝读写优化

单纯用bytearray仍可能隐式拷贝——比如切片ba[10:20]返回的是新bytearray,不是视图。真正避免内存复制的方法是搭配memoryview

ba = bytearray(1024)
mv = memoryview(ba)
# 下面所有操作都直接作用于原始内存,无拷贝
mv[0] = 0xff
chunk = mv[100:200]  # 还是memoryview,不是新bytearray

注意:memoryview不能脱离原始对象生命周期存在,若ba被垃圾回收,mv会变成dead状态,访问时报ValueError: memoryview: operation forbidden on released memoryview object

  • memoryview支持所有bytearray的索引/切片语法,但不支持.append()等扩容操作
  • 传给C扩展(如numpy.frombufferstruct.unpack_from)时,memoryviewbytearray更高效,因后者需先转为memoryview
  • Python 3.12+ 中memoryview.cast()可安全重解释字节布局,比如把uint8视图转成uint32,省去struct.unpack调用

Bytes和Bytearray在I/O操作中的实际差异很小

调用socket.send()file.write()等底层I/O函数时,CPython会统一通过PyBuffer_GetBuffer提取缓冲区指针,无论输入是bytesbytearray还是memoryview,最终走的都是同一套零拷贝路径。实测10MB数据发送,三者耗时差异在±0.5%以内。

真正影响I/O性能的是缓冲区大小和系统调用次数,而不是类型选择。例如:

  • bytearray(8192)做固定大小读缓冲,比反复bytes()拼接快得多
  • 但若用bytearray.extend(data)累积接收数据,每次扩容可能触发realloc,反而不如分块存入list[bytes]b''.join()
  • socket.recv_into(bytearray)socket.recv()少一次内存分配,这是明确的性能收益点

别忽略GC压力:Bytearray长期持有大内存可能拖慢程序

bytearray对象一旦分配大块内存(比如bytearray(100_000_000)),即使后续只用前1KB,整个100MB仍驻留堆中,直到该对象被回收。而bytes是不可变的,CPython对小对象有专门的内存池,且更容易被及时回收。

容易被忽略的点:

  • bytearray做缓存时,记得在不用后显式del ba或置空ba[:] = b'',否则引用残留会阻止GC
  • 多线程环境下,bytearray不是线程安全的,ba[i] = xba.append(y)并发执行可能导致数据错乱,必须加锁
  • 序列化(picklebytearraybytes慢约3倍,因为要记录可变性元信息

复杂点在于:没有银弹。是否用bytearray取决于「修改频率」「生命周期控制」「是否与其他C API交互」三个条件同时满足的程度。多数网络服务代码里,memoryview + 小块bytearray缓冲 + 显式生命周期管理,才是真实压测中跑出来的组合解法。

今天关于《Bytearray与Bytes性能对比解析》的内容介绍就到此结束,如果有什么疑问或者建议,可以在golang学习网公众号下多多回复交流;文中若有不正之处,也希望回复留言以告知!

资料下载
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>