登录
首页 >  文章 >  python教程

Python迭代器与生成器实战指南

时间:2026-01-30 22:26:36 420浏览 收藏

文章小白一枚,正在不断学习积累知识,现将学习到的知识记录一下,也是将我的所得分享给大家!而今天这篇文章《Python迭代器与生成器实战教程》带大家来了解一下##content_title##,希望对大家的知识积累有所帮助,从而弥补自己的不足,助力实战开发!


迭代器是实现__iter__()和__next__()方法的对象,支持按需遍历;生成器是用yield定义的函数,自动实现迭代器协议,二者均支持延迟加载与内存高效遍历。

Python迭代器与生成器教程_高效遍历与延迟加载实战

Python中的迭代器和生成器是实现高效遍历与延迟加载的核心机制。它们不一次性把所有数据装入内存,而是按需产出,特别适合处理大文件、数据库游标、无限序列或计算开销大的场景。

什么是迭代器:满足协议的对象

迭代器是一个实现了__iter__()__next__()两个方法的对象。调用__iter__()返回自身,__next__()每次返回一个元素,耗尽后抛出StopIteration异常。

  • 内置类型如liststrdict本身不是迭代器,但可通过iter()函数获得迭代器
  • 手动实现一个计数迭代器:

class Countdown:
  def __init__(self, start):
    self.current = start
  def __iter__(self):
    return self
  def __next__(self):
    if self.current
      raise StopIteration
    self.current -= 1
    return self.current + 1

for n in Countdown(3): print(n) # 输出:3 2 1

生成器:更简洁的迭代器写法

生成器函数使用yield关键字,每次执行到yield就暂停并返回值,下次调用继续从暂停处运行。Python自动为其生成__iter____next__方法。

  • 生成器表达式语法类似列表推导式,但用圆括号:(x**2 for x in range(10)),返回生成器对象,不立即计算
  • 适合替代简单循环逻辑,避免手动管理状态
  • 示例:逐行读取大文件,不加载全文到内存

def read_large_file(filepath):
  with open(filepath, 'r') as f:
    for line in f:
      yield line.strip()

# 使用时按需取行
for line in read_large_file('huge.log'):
  if 'ERROR' in line:
    print(line)

yield from:简化嵌套生成器委托

当一个生成器需要复用另一个生成器的产出时,用yield from可避免手动循环yield,还能正确传递send()throw()close()信号。

  • 等价于:for item in subgen: yield item,但更高效、语义更清晰
  • 常用于递归结构(如树遍历)或组合多个数据源

def chain_generators(*gens):
  for gen in gens:
    yield from gen

gen1 = (x for x in [1, 2])
gen2 = (x for x in [3, 4])
for x in chain_generators(gen1, gen2): print(x) # 输出:1 2 3 4

实战技巧:何时用生成器?怎么优化?

生成器不是万能的——它只能遍历一次、无法索引、不能回退。但正是这些限制换来了内存与性能优势。

  • ✅ 适合:流式处理(日志/网络响应)、大数据集分批、动态计算序列(斐波那契、素数)、协程通信基础
  • ❌ 避免:需多次遍历、随机访问、调试时频繁检查中间值(可用list(gen)临时转为列表,但注意内存)
  • ? 提示:配合itertools模块(如islicetakewhile)可安全截取或条件过滤生成器

以上就是本文的全部内容了,是否有顺利帮助你解决问题?若是能给你带来学习上的帮助,请大家多多支持golang学习网!更多关于文章的相关知识,也可关注golang学习网公众号。

前往漫画官网入口并下载 ➜
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>