迭代器与生成器

一.迭代和可迭代协议

  迭代:简单来说,就是可以将数据集内的数据一个挨一个取出来

  可以被迭代要满足的要求就是可迭代协议,要想可迭代,内部必需有一个_iter_方法

二.迭代器

  迭代器遵循协议:必须有_iter_、_next_方法

  迭代器的_next_方法(不依赖for循环实现遍历)

 1 l = [1,2,3,4]
 2 l_iter = l.__iter__()
 3 item = l_iter.__next__()
 4 print(item)
 5 item = l_iter.__next__()
 6 print(item)
 7 item = l_iter.__next__()
 8 print(item)
 9 item = l_iter.__next__()
10 print(item)
11 item = l_iter.__next__()
12 print(item)

  由于元素只有四个,所以迭代不到数据会报错(用异常处理机制解决)

1 l = [1,2,3,4]
2 l_iter = l.__iter__()
3 while True:
4     try:
5         item = l_iter.__next__()
6         print(item)
7     except StopIteration:
8         break

  range()  (可迭代的对象,但不是一个迭代器)

三.生成器

  两种迭代器:

  一种是调用方法直接返回的,一种是可迭代对象通过执行_iter_方法,迭代器有个好处就是可以节省内存

  我们自己写的实现迭代器功能的东西就叫迭代器

  python中提供的生成器

  1.生成器函数:常规函数定义,但是使用的是yield返回语句而不是return语句返回的结果。yield语句一次返回一个结果,在每个结果中间,挂起函数的状态,以便下次从它离开的地方继续执行。

  2.生成器表达式:类似于列表推导,但是生成器返回按需产生结果的一个对象,而不是一次产生一个结果列表

  生成器本质:迭代器,自带了iter和next方法,不用我们去实现

  特点:惰性运算,开发者自定义

四.生成器函数

  一个包含yield关键字的函数就是一个生成器函数。yield可以为我们从函数中返回值,但是yield又不同于return,return的执行意味着程序的结束,调用生成器函数不会得到返回的具体的值,而是得到一个可迭代的对象。每一次获取这个可迭代对象的值,就能推动函数的执行,获取新的返回值。直到函数执行结束。

 1 import time
 2 def genrator_fun1():
 3     a = 1
 4     print('现在定义了a变量')
 5     yield a
 6     b = 2
 7     print('现在又定义了b变量')
 8     yield b
 9 
10 g1 = genrator_fun1()
11 print('g1 : ',g1)       #打印g1可以发现g1就是一个生成器
12 print('-'*20)   #我是华丽的分割线
13 print(next(g1))
14 time.sleep(1)   #sleep一秒看清执行过程
15 print(next(g1))

  生成器监听文件输入的内容

 1 import time
 2 
 3 def tail(filename):
 4     f = open(filename)
 5     f.seek(0, 2) #从文件末尾算起
 6     while True:
 7         line = f.readline()  # 读取文件中新的文本行
 8         if not line:
 9             time.sleep(0.1)
10             continue
11         yield line
12 
13 tail_g = tail('tmp')
14 for line in tail_g:
15     print(line)

  计算移动平均值

 1 def averager():
 2     total = 0.0
 3     count = 0
 4     average = None
 5     while True:
 6         term = yield average
 7         total += term
 8         count += 1
 9         average = total/count
10 
11 
12 g_avg = averager()
13 next(g_avg)
14 print(g_avg.send(10))
15 print(g_avg.send(30))
16 print(g_avg.send(5))
17 

  预激协程装饰器

 1 def init(func):  #在调用被装饰生成器函数的时候首先用next激活生成器
 2     def inner(*args,**kwargs):
 3         g = func(*args,**kwargs)
 4         next(g)
 5         return g
 6     return inner
 7 
 8 @init
 9 def averager():
10     total = 0.0
11     count = 0
12     average = None
13     while True:
14         term = yield average
15         total += term
16         count += 1
17         average = total/count
18 
19 
20 g_avg = averager()
21 # next(g_avg)   在装饰器中执行了next方法
22 print(g_avg.send(10))
23 print(g_avg.send(30))
24 print(g_avg.send(5))
25 
26 预激协程的装饰器

  yield from

 1 def gen1():
 2     for c in 'AB':
 3         yield c
 4     for i in range(3):
 5         yield i
 6 
 7 print(list(gen1()))
 8 
 9 def gen2():
10     yield from 'AB'
11     yield from range(3)
12 
13 print(list(gen2()))
14 
15 yield from

  总结:列表解析和生成器表达式相比,后者更节省内存

原文地址:https://www.cnblogs.com/sxh-myblogs/p/7274565.html