首页 > 文章 > python教程

Bytearray与Bytes性能对比解析

时间：2026-04-16 19:08:38 189浏览收藏

本文深入剖析了bytearray与bytes在Python中的性能差异与适用边界：bytearray仅在频繁原地修改场景下胜出，因其可变性避免重复内存分配，但单次构造或纯读取时bytes凭借C层深度优化反而更快；真正零拷贝的关键在于memoryview的配合使用，而非单纯依赖bytearray；I/O操作中二者实际性能几乎无差，决定性因素是缓冲策略与系统调用效率；同时必须警惕bytearray的大内存驻留、GC压力、线程不安全及序列化开销等隐性成本——实践中，唯有结合修改频率、生命周期管理与C API交互需求，采用memoryview+小块bytearray+显式清理的组合方案，才能在真实压测中实现最优性能。

Python中Bytearray比Bytes快吗_可变字节序列的内存读写优化

Bytearray的写入性能确实比Bytes高，但只在频繁修改时成立

因为bytes是不可变对象，每次切片、拼接或替换都会生成新对象，触发内存分配和拷贝；而bytearray是可变对象，原地修改不产生新对象。但这个优势仅在「多次写入」场景下体现——如果只是读取或单次构造，bytes反而更快（C层优化更彻底，且无额外可变性开销）。

常见错误现象：TypeError: 'bytes' object does not support item assignment，试图直接改bytes[i]时抛出，这时才真正需要切换到bytearray。

适用场景：协议解析中逐字节填充缓冲区、加密算法中的状态数组、网络包组装
不适用场景：HTTP响应体读取、文件哈希计算（只读）、JSON二进制编码输出
构造开销：bytearray(b'abc') 比 bytes(b'abc') 多约15%初始化时间，但后续10次以上[i] = x操作就能抹平

用`memoryview`绕过复制，才是真正的零拷贝读写优化

单纯用bytearray仍可能隐式拷贝——比如切片ba[10:20]返回的是新bytearray，不是视图。真正避免内存复制的方法是搭配memoryview：

ba = bytearray(1024)
mv = memoryview(ba)
# 下面所有操作都直接作用于原始内存，无拷贝
mv[0] = 0xff
chunk = mv[100:200]  # 还是memoryview，不是新bytearray

注意：memoryview不能脱离原始对象生命周期存在，若ba被垃圾回收，mv会变成dead状态，访问时报ValueError: memoryview: operation forbidden on released memoryview object。

memoryview支持所有bytearray的索引/切片语法，但不支持.append()等扩容操作
传给C扩展（如numpy.frombuffer、struct.unpack_from）时，memoryview比bytearray更高效，因后者需先转为memoryview
Python 3.12+ 中memoryview.cast()可安全重解释字节布局，比如把uint8视图转成uint32，省去struct.unpack调用

Bytes和Bytearray在I/O操作中的实际差异很小

调用socket.send()、file.write()等底层I/O函数时，CPython会统一通过PyBuffer_GetBuffer提取缓冲区指针，无论输入是bytes、bytearray还是memoryview，最终走的都是同一套零拷贝路径。实测10MB数据发送，三者耗时差异在±0.5%以内。

真正影响I/O性能的是缓冲区大小和系统调用次数，而不是类型选择。例如：

用bytearray(8192)做固定大小读缓冲，比反复bytes()拼接快得多
但若用bytearray.extend(data)累积接收数据，每次扩容可能触发realloc，反而不如分块存入list[bytes]再b''.join()
socket.recv_into(bytearray)比socket.recv()少一次内存分配，这是明确的性能收益点