登录
首页 >  文章 >  python教程

Python迭代器与生成器详解

时间:2025-07-11 14:30:47 435浏览 收藏

哈喽!大家好,很高兴又见面了,我是golang学习网的一名作者,今天由我给大家带来一篇《Python迭代器与生成器使用全解析》,本文主要会讲到等等知识点,希望大家一起学习进步,也欢迎大家关注、点赞、收藏、转发! 下面就一起来看看吧!

迭代器是实现__iter__()和__next__()方法的对象,用于按需遍历数据;生成器是使用yield的特殊迭代器,能延迟计算节省内存。1.迭代器通过next()逐个获取元素,如列表需用iter()转换;2.自定义迭代器需定义类并实现两个方法,如MyCounter控制遍历状态;3.生成器用yield暂停执行,如fibonacci()按需生成数列;4.生成器表达式用()且不占内存,适合处理大数据,如逐行读取大文件。

Python中如何使用迭代器?生成器应用解析

在Python中,迭代器和生成器是处理数据流的重要工具。它们不仅能让代码更简洁高效,还能节省内存资源,特别是在处理大规模数据时非常有用。

Python中如何使用迭代器?生成器应用解析

什么是迭代器?

迭代器是一个可以记住遍历位置的对象。它实现了两个方法:__iter__()__next__()。使用迭代器可以按需获取元素,而不是一次性把所有数据加载到内存中。

Python中如何使用迭代器?生成器应用解析

常见的可迭代对象包括列表、字符串、字典等。但这些本身并不是迭代器,需要用 iter() 函数转换一下才能变成迭代器。

比如:

Python中如何使用迭代器?生成器应用解析
my_list = [1, 2, 3]
it = iter(my_list)
print(next(it))  # 输出 1
print(next(it))  # 输出 2

当你用完所有元素后再调用 next(),会抛出 StopIteration 异常,这是迭代结束的标志。


自定义迭代器怎么写?

如果你想自己实现一个迭代器,只需要定义一个类,并实现 __iter__()__next__() 方法。

举个例子,我们来写一个简单的计数器迭代器:

class MyCounter:
    def __init__(self, start=0, end=5):
        self.current = start
        self.end = end

    def __iter__(self):
        return self

    def __next__(self):
        if self.current < self.end:
            num = self.current
            self.current += 1
            return num
        else:
            raise StopIteration

# 使用
counter = MyCounter(1, 4)
for num in counter:
    print(num)
# 输出:
# 1
# 2
# 3

这个自定义迭代器可以在循环中自动控制状态,适合用来封装一些有规律的数据结构或逻辑。


生成器是什么?怎么用?

生成器是一种特殊的迭代器,它的写法比类简单很多,使用 yield 关键字就能实现。

相比普通函数返回一个值后就结束了,生成器函数每次遇到 yield 会暂停并保存当前状态,下次调用再继续执行。

比如下面这个生成器,可以无限生成斐波那契数列:

def fibonacci():
    a, b = 0, 1
    while True:
        yield a
        a, b = b, a + b

fib = fibonacci()
print(next(fib))  # 0
print(next(fib))  # 1
print(next(fib))  # 1
print(next(fib))  # 2

你也可以像这样限制输出次数:

for i, val in enumerate(fib):
    if i >= 10:
        break
    print(val)

这种方式非常适合处理大数据或者需要延迟计算的场景。


生成器表达式 vs 列表推导式

如果你熟悉列表推导式,你会发现生成器表达式的写法几乎一样,只是用小括号 () 而不是方括号 []

  • 列表推导式:[x**2 for x in range(10)]
  • 生成器表达式:(x**2 for x in range(10))

区别在于:

  • 列表推导式会立刻生成全部数据;
  • 生成器表达式则是“按需”生成,不占内存。

所以,当你只关心逐个访问元素而不必一次全存下来时,用生成器表达式更高效。


实际应用场景举例

  • 读取大文件:一行一行读取,避免一次性加载整个文件;
  • 网络爬虫:边抓取边处理,减少等待时间;
  • 实时数据流处理:比如传感器持续传来的数据;
  • 简化递归结构遍历:比如树形结构的深度优先遍历。

例如,读取一个超大日志文件:

def read_large_file(file_path):
    with open(file_path, 'r') as f:
        for line in f:
            yield line.strip()

log_lines = read_large_file('big_log.txt')
for line in log_lines:
    print(line)  # 每次只处理一行

这种方式不会因为文件太大而导致内存溢出。


基本上就这些了。迭代器和生成器看似概念性强,其实用起来并不难。关键是理解它们“按需生成”的特性,在合适的地方用上,能让你的程序既优雅又高效。

今天关于《Python迭代器与生成器详解》的内容介绍就到此结束,如果有什么疑问或者建议,可以在golang学习网公众号下多多回复交流;文中若有不正之处,也希望回复留言以告知!

相关阅读
更多>
最新阅读
更多>
课程推荐
更多>