登录
首页 >  文章 >  python教程

Python字节码执行过程详解

时间:2026-05-16 13:35:43 113浏览 收藏

本文深入剖析了Python字节码从源代码到最终执行的完整生命周期,清晰揭示了CPython如何将人类可读的.py文件编译为.pyc字节码文件、如何将其加载为携带丰富元信息的code object、又如何由基于栈的Python虚拟机(PVM)逐条解释执行——每一步都涉及关键数据结构(如帧对象、求值栈、堆上对象)和底层机制(如引用计数、指令跳转、函数调用栈管理),不仅帮你穿透“Python是解释型语言”的表象,更让你真正理解为什么print(1+1)背后是LOAD_CONST、BINARY_ADD和RETURN_VALUE的协同运作,以及所有看似简单的语句如何在C实现的虚拟机中被精准调度与执行。

Python 字节码执行流程解析

Python 字节码不是直接由硬件运行的机器码,而是由 Python 虚拟机(CPython 的 PVM)解释执行的中间表示。理解其执行流程,关键在于看清“源码 → 编译 → 字节码 → 解释执行”这四个环节中每一步做了什么、谁在参与、以及数据如何流转。

源代码被编译成字节码(.pyc 文件)

当你运行 python script.py 或导入一个模块时,CPython 会先检查是否存在对应时间戳更新的 __pycache__/script.cpython-312.pyc(版本号因 Python 版本而异)。若不存在或过期,就调用内置的编译器将源码解析为抽象语法树(AST),再优化并生成字节码指令序列。

你可以手动触发编译:

  • import py_compile; py_compile.compile('script.py')
  • python -m py_compile script.py

生成的 .pyc 文件本质是二进制容器,包含魔法数、时间戳、源码路径和真正的字节码(co_code 字段)。

字节码以 code object 形式加载进内存

执行前,Python 将 .pyc 中的字节码载入为一个 code object(不可变对象),它还携带了常量表(co_consts)、变量名(co_names)、局部名(co_varnames)、栈需求(co_stacksize)等元信息。这些信息共同决定虚拟机如何执行该段字节码。

例如,执行 dis.dis(lambda x: x + 1) 会显示:

  • LOAD_FAST(从局部变量槽取 x)
  • LOAD_CONST(从 co_consts 取整数 1)
  • BINARY_ADD(执行加法)
  • RETURN_VALUE(返回结果)

每条指令都依赖 code object 提供的上下文才能正确寻址和操作。

PVM 按顺序读取并执行字节码指令

Python 虚拟机是一个基于栈的解释器。它维护一个求值栈(evaluation stack)和当前帧对象(frame object),帧中保存局部变量、上层帧引用、指令指针(f_lasti)等。PVM 循环执行:读取下一条指令 → 解析操作码与参数 → 调用对应逻辑(如 Pyeval_EvalFrameDefault 中的 switch-case 分支)→ 更新栈与状态 → 移动指令指针。

典型行为包括:

  • 遇到 LOAD_NAME:查 globals/locals 字典,压栈
  • 遇到 CALL_FUNCTION:弹出参数和函数对象,新建帧并跳转执行
  • 遇到 JUMP_ABSOLUTE:修改 f_lasti 实现跳转(支撑循环与条件)

没有 JIT,纯解释执行;每条字节码指令背后都是 C 函数调用,开销可见。

执行结果由帧对象和对象系统承载

字节码本身不存储数据,所有运行时对象(int、list、function 等)都分配在堆上,由引用计数 + 垃圾回收管理。帧对象只存指向这些对象的指针。比如 a = [1, 2] 对应的字节码会创建 list 对象并把地址写入局部变量槽,后续 a.append(3) 则通过该指针调用对象方法。

函数调用、异常抛出、生成器挂起等高级行为,也都映射为帧状态变更(如 f_back、f_exc_info、f_gen 等字段赋值),而非字节码直译。

到这里,我们也就讲完了《Python字节码执行过程详解》的内容了。个人认为,基础知识的学习和巩固,是为了更好的将其运用到项目中,欢迎关注golang学习网公众号,带你了解更多关于的知识点!

资料下载
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>