生成器 Generator

我们有时候需要一个可迭代对象。比如列表,但遇到海量数据时往往非常耗内存,费空间,这时不妨考虑使用生成器。

生成器是迭代器,只能遍历一次,返回一个生成器对象。特点:按需计算,惰性求值。

定义生成器的表达式:
g = (i for i in range(10))
>>> g
<generator object <genexpr> at 0x00000200BFA71570>

next()函数可以不断获得下一个返回值,generator保存的是算法,每次调用next(g),就计算出g的下一个元素的值,直到计算到最后一个元素,没有更多的元素时,抛出StopIteration的错误。

通常我们创建了一个generator后,基本上永远不会调用next(),而是通过for循环来迭代它,并且不需要关心StopIteration的错误。

当生成器表达式无法实现复杂算法时,可以定义函数:
def inc():
    for i in range(5):
    yield i

等价于

def inc():
    yield from range(1000)

# yield from iterable 是 for item in iterable: yield item 的语法糖

如果一个函数定义中包含yield关键字,那么这个函数就不再是一个普通函数,而是一个generator,可用于迭代。

yield是一个类似return的关键字,迭代一次遇到yield时就返回yield右边的值,并且记住这个返回的位置,下次迭代就从这个位置后(下一行)开始。

案例
def inc():
    for i in range(5):
        yield i


print(type(inc)
x = inc()
print(x)
print(type(x))
print(next(x))
for m in x:
    print(m, '*')
for m in x:
    print(m, '**')

运行结果:
<class 'function'>
<generator object inc at 0x0000024F97ED15C8>
<class 'generator'>
0
1 *
2 *
3 *
4 *
可以看出返回一个对象,并且只能遍历一次。
原文地址:https://www.cnblogs.com/liguanzhen/p/8856110.html