Python的可迭代对象、迭代器和生成器

可迭代对象(Iterable)

这些可以直接作用于for循环的对象统称为可迭代对象:Iterable

我们已经知道,可以直接作用于for循环的数据类型有以下几种:

  • 一类是集合数据类型,如listtupledictsetstr等;
  • 一类是generator,包括生成器和带yield的generator function。

可以使用isinstance()判断一个对象是否是Iterable对象:

from collections import Iterable
isinstance([], Iterable)

  

生成器(generator )

生成器不但可以作用于for循环,还可以被next()函数不断调用并返回下一个值,直到最后抛出StopIteration错误表示无法继续返回下一个值了。

创建一个generator:

  • 第一种方法很简单,只要把一个列表生成式的[]改成(),就创建了一个generator;
L = [x * x for x in range(10)]

#<generator object <genexpr> at 0x1022ef630>
g = (x * x for x in range(10))
  •  如果一个函数定义中包含yield关键字,那么这个函数就不再是一个普通函数,而是一个generator:最难理解的就是generator和函数的执行流程不一样。函数是顺序执行,遇到return语句或者最后一行函数语句就返回。而变成generator的函数,在每次调用next()的时候执行,遇到yield语句返回,再次执行时从上次返回的yield语句处继续执行。 
  • 生成器都是Iterator对象;

迭代器(Iterator)

凡是可作用于next()函数的对象都是Iterator类型,它们表示一个惰性计算的序列;

  • 集合数据类型如listdictstr等是Iterable但不是Iterator,不过可以通过iter()函数获得一个Iterator对象。
isinstance(iter([]), Iterator)
#True
isinstance([], Iterator)
#False
  • Iterator本质是一个:长度未知的抽象数据流(也可能是无限长),在需要返回下一个数据时调用next( )得到;
  • 为什么listdictstr等数据类型不是Iterator?  这是因为Python的Iterator对象表示的是一个数据流,Iterator对象可以被next()函数调用并不断返回下一个数据,直到没有数据时抛出StopIteration错误。可以把这个数据流看做是一个有序序列,但我们却不能提前知道序列的长度,只能不断通过next()函数实现按需计算下一个数据,所以Iterator的计算是惰性的,只有在需要返回下一个数据时它才会计算。

#Python的for循环本质上就是通过不断调用next()函数实现的。

原文地址:https://www.cnblogs.com/eniac1946/p/8573711.html