登录
首页 >  文章 >  python教程

Python字节码执行过程全解析

时间:2026-03-18 14:32:31 330浏览 收藏

Python字节码执行并非直接运行机器码,而是经历“源码→编译为.pyc文件→加载为含丰富元信息的code object→由基于栈的CPython虚拟机(PVM)逐条解释执行”这一精巧闭环;整个过程融合了AST解析、常量与变量上下文管理、求值栈操作、帧对象状态调度以及堆上对象的动态生命周期控制,深入理解它不仅能揭开Python“慢”的底层原因,更能帮你精准优化性能、调试异常、甚至定制解释器行为——原来每一行Python代码背后,都是一场虚拟机与内存、指令与引用的精密协作。

Python 字节码执行流程解析

Python 字节码不是直接由硬件运行的机器码,而是由 Python 虚拟机(CPython 的 PVM)解释执行的中间表示。理解其执行流程,关键在于看清“源码 → 编译 → 字节码 → 解释执行”这四个环节中每一步做了什么、谁在参与、以及数据如何流转。

源代码被编译成字节码(.pyc 文件)

当你运行 python script.py 或导入一个模块时,CPython 会先检查是否存在对应时间戳更新的 __pycache__/script.cpython-312.pyc(版本号因 Python 版本而异)。若不存在或过期,就调用内置的编译器将源码解析为抽象语法树(AST),再优化并生成字节码指令序列。

你可以手动触发编译:

  • import py_compile; py_compile.compile('script.py')
  • python -m py_compile script.py

生成的 .pyc 文件本质是二进制容器,包含魔法数、时间戳、源码路径和真正的字节码(co_code 字段)。

字节码以 code object 形式加载进内存

执行前,Python 将 .pyc 中的字节码载入为一个 code object(不可变对象),它还携带了常量表(co_consts)、变量名(co_names)、局部名(co_varnames)、栈需求(co_stacksize)等元信息。这些信息共同决定虚拟机如何执行该段字节码。

例如,执行 dis.dis(lambda x: x + 1) 会显示:

  • LOAD_FAST(从局部变量槽取 x)
  • LOAD_CONST(从 co_consts 取整数 1)
  • BINARY_ADD(执行加法)
  • RETURN_VALUE(返回结果)

每条指令都依赖 code object 提供的上下文才能正确寻址和操作。

PVM 按顺序读取并执行字节码指令

Python 虚拟机是一个基于栈的解释器。它维护一个求值栈(evaluation stack)和当前帧对象(frame object),帧中保存局部变量、上层帧引用、指令指针(f_lasti)等。PVM 循环执行:读取下一条指令 → 解析操作码与参数 → 调用对应逻辑(如 Pyeval_EvalFrameDefault 中的 switch-case 分支)→ 更新栈与状态 → 移动指令指针。

典型行为包括:

  • 遇到 LOAD_NAME:查 globals/locals 字典,压栈
  • 遇到 CALL_FUNCTION:弹出参数和函数对象,新建帧并跳转执行
  • 遇到 JUMP_ABSOLUTE:修改 f_lasti 实现跳转(支撑循环与条件)

没有 JIT,纯解释执行;每条字节码指令背后都是 C 函数调用,开销可见。

执行结果由帧对象和对象系统承载

字节码本身不存储数据,所有运行时对象(int、list、function 等)都分配在堆上,由引用计数 + 垃圾回收管理。帧对象只存指向这些对象的指针。比如 a = [1, 2] 对应的字节码会创建 list 对象并把地址写入局部变量槽,后续 a.append(3) 则通过该指针调用对象方法。

函数调用、异常抛出、生成器挂起等高级行为,也都映射为帧状态变更(如 f_back、f_exc_info、f_gen 等字段赋值),而非字节码直译。

今天关于《Python字节码执行过程全解析》的内容就介绍到这里了,是不是学起来一目了然!想要了解更多关于的内容请关注golang学习网公众号!

资料下载
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>