登录
首页 >  文章 >  python教程

Python迭代器原理与实战全解析

时间:2026-04-12 19:11:59 391浏览 收藏

Python迭代器并非语法糖,而是由`__iter__`和`next__`共同定义的底层协议——只要对象响应`iter()`调用(优先查`__iter__`,再退化尝试`__getitem__(0)`),它就是可迭代的;`for`循环靠此协议无缝工作,而`StopIteration`在循环中是优雅退出信号,在手动调用`next()`时却是必须捕获的异常;相比易出错的手写迭代器类,生成器函数以`yield`自动管理状态、更轻量安全,`itertools`中的`chain`、`islice`、`tee`等则提供高效惰性操作,不预加载全量数据,但需警惕`tee`的缓冲膨胀风险;真正进阶在于根据场景明智选择:生成器适合简单流式逻辑,`itertools`组合擅长复用与切片,而复杂有状态的解析器才需手写类。

Python迭代器系统学习路线第208讲_核心原理与实战案例详解【教程】

Python 迭代器不是语法糖,而是 __iter____next__ 两个方法共同构成的协议;只要对象实现了这个协议,它就是迭代器——哪怕没继承 Iterator 类。

为什么 for 循环能遍历列表但不能直接遍历整数

因为 list 实现了 __iter__,返回一个迭代器对象;而 int 没有该方法,调用 iter(42) 会抛出 TypeError: 'int' object is not iterable。关键不在类型,而在是否响应 iter() 调用。

  • iter(obj) 先尝试调用 obj.__iter__()
  • 若未实现,再尝试 obj.__getitem__(0)(仅限从 0 开始的连续索引)
  • 两者都失败,才报错

StopIteration 是信号,不是异常(在循环里)

手动调用 next(it) 时,StopIteration 真的是异常,必须捕获;但在 for 中它是正常退出机制,不会暴露给用户。误把 next(it) 放进循环体又不捕获,会导致程序中断。

it = iter([1, 2])
print(next(it))  # 1
print(next(it))  # 2
print(next(it))  # 触发 StopIteration —— 此处不捕获就会报错

生成器函数比手写迭代器类更轻量、更安全

手写类需显式维护状态、处理边界、返回 selfraise StopIteration;生成器函数用 yield 自动封装这些逻辑,且天然支持暂停/恢复。

  • 类迭代器容易漏写 __iter__ 返回 self,导致多次 for 循环复用同一个迭代器失效
  • 生成器函数每次调用 func() 都返回新迭代器,无状态污染
  • yield from 可委托子生成器,避免手动 for + yield

itertools 中的 chainislicetee 不缓存全部数据

它们返回的是惰性迭代器,只在被消费时计算。例如 islice(range(10**9), 10) 不会构造十亿元素的列表,只取前 10 个;但 tee(it, 2) 会内部缓存已读未分发的项,若一个分支远超另一个,内存可能涨得很快。

  • chain(a, b):串联多个可迭代对象,不展开、不复制
  • islice(it, start, stop, step):类似切片,但不支持负索引
  • tee(it, n):拆成 n 个独立迭代器,底层共享一个缓冲区

真正难的不是写出能跑的迭代器,而是判断什么时候该用生成器函数、什么时候该用 itertools 组合、什么时候必须手写类(比如需要带参数重置状态的流式解析器)。

今天关于《Python迭代器原理与实战全解析》的内容就介绍到这里了,是不是学起来一目了然!想要了解更多关于的内容请关注golang学习网公众号!

资料下载
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>