迭代器与生成器

1 迭代器

迭代器指的是迭代取值的工具，迭代是一个重复的过程，并且每次重复都是基于上一次的结果而继续的，

单纯的重复并不是迭代!

1.1 迭代器的作用

迭代器是用来迭代取值的工具，而涉及到把多个值循环取出来的类型
有：列表、字符串、元组、字典、集合、打开文件

l = ['egon', 'liu', 'alex']
i = 0
while i < len(l):
    print(l[i])
    i += 1

上述迭代取值的方式只适用于有索引的数据类型：列表、字符串、元组
为了解决基于索引迭代器取值的局限性
python必须提供一种能够不依赖于索引的取值方式，这就是迭代器

1.2 迭代器的使用

1.2.1 可迭代的对象

但凡内置有__iter__方法的对象都称之为可迭代的对象

s1=''
s1.__iter__()

l=[]
l.__iter__()

t=(1,)
t.__iter__()

d={'a':1}
d.__iter__()

set1={1,2,3}
set1.__iter__()

with open('a.txt',mode='w') as f:
    f.__iter__()
    pass

1.2.2 迭代器对象

调用可迭代对象下的__iter__方法会将其转换成迭代器对象

内置有__next__方法并且内置有__iter__方法的对象就称为迭代器对象

d={'a':1,'b':2,'c':3}
d_iterator=d.__iter__()
print(d_iterator)				# <dict_keyiterator object at 0x0000022FF0E13A90>

print(d_iterator.__next__())	# a
print(d_iterator.__next__())	# b
print(d_iterator.__next__())	# c
print(d_iterator.__next__())	# 抛出异常StopIteration,值取完了

d={'a':1,'b':2,'c':3}
d_iterator=d.__iter__()

while True:
    try:
        print(d_iterator.__next__())
    except StopIteration:
        break
# 得到"a","b","c"
print('====>>>>>>') # 在一个迭代器取值取完后，再对其取值就会报错
d_iterator=d.__iter__()
while True:
    try:
        print(d_iterator.__next__())
    except StopIteration:
        break
# 什么都得不到,因为迭代器值已取完


l=[1,2,3,4,5]
l_iterator=l.__iter__()

while True:
    try:
        print(l_iterator.__next__())
    except StopIteration:
        break
# 得到1,2,3,4,5

1.3 可迭代对象与迭代器对象详解

1.3.1 可迭代对象（"可以转换成迭代器的对象"）

内置有__iter__方法的对象

可迭代对象使用.__iter__(): 得到迭代器对象

1.3.2 迭代器对象

内置有__next__方法并且内置有__iter__方法的对象
迭代器对象.__next__（）：得到迭代器的下一个值
迭代器对象.__iter__（）：得到迭代器的本身，调用和没调用相同

dic={'a':1,'b':2,'c':3}

dic_iterator=dic.__iter__()
print(dic_iterator is dic_iterator.__iter__().__iter__().__iter__())
# True

1.3.3 数据类型分类

可迭代对象：字符串、列表、元组、字典、集合、文件对象
迭代器对象：文件对象

s1=''
s1.__iter__()

l=[]
l.__iter__()

t=(1,)
t.__iter__()


d={'a':1}
d.__iter__()

set1={1,2,3}
set1.__iter__()


with open('a.txt',mode='w') as f:
    f.__iter__()
    f.__next__()

1.4 for循环的工作原理

for循环可以称之为叫迭代器循环

d={'a':1,'b':2,'c':3}

1、d.__iter__()得到一个迭代器对象
2、迭代器对象.__next__()拿到一个返回值，然后将该返回值赋值给k
3、循环往复步骤2，直到抛出StopIteration异常for循环会捕捉异常然后结束循环

d={'a':1,'b':2,'c':3}
for k in d:			# d_it = d.__iter__()
    print(k)		# 循环k = d_it.__next__()直到抛出异常结束循环


with open('a.txt',mode='rt',encoding='utf-8') as f:
    for line in f: # f.__iter__()
        print(line)


list('hello') #原理同for循环

1.5 迭代器优缺点总结

优点:

I、为序列和非序列类型提供了一种统一的迭代取值方式。
II、惰性计算：迭代器对象表示的是一个数据流，可以只在需要时才去调用next来计算出一个值，就迭代器本身来说，同一时刻在内存中只有一个值，因而可以存放无限大的数据流，而对于其他容器类型，如列表，需要把所有的元素都存放于内存中，受内存大小的限制，可以存放的值的个数是有限的。

缺点:

I、除非取尽，否则无法获取迭代器的长度

II、只能取下一个值，不能回到开始，更像是‘一次性的’，迭代器产生后的唯一目标就是重复执行next方法直到值取尽，否则就会停留在某个位置，等待下一次调用next；若是要再次迭代同个对象，你只能重新调用iter方法去创建一个新的迭代器对象，如果有两个或者多个循环使用同一个迭代器，必然只会有一个循环能取到值。

2 生成器

生成器就是一个自定义的迭代器

生成器就是迭代器

2.1 生成器的使用

在函数内一旦存在yield关键字，调用函数并不会执行函数体代码
会返回一个生成器对象，生成器即自定义的迭代器

def func():
    print('第一次')
    yield 1
    print('第二次')
    yield 2
    print('第三次')
    yield 3
    print('第四次')

g=func()
print(g)
# 生成器就是迭代器
g.__iter__()

# g.__next__()会触发函数体代码的运行，然后遇到yield停下来，将yield后的值
# 当做本次调用的结果返回

g = func()
print(g)

g.__iter__()

res1 = g.__next__()
# 第一次
print(res1)
# 1

res2 = g.__next__()
# 第二次
print(res2)
# 2

res3 = g.__next__()
# 第三次
print(res3)
# 3

res4 = g.__next__()
# 第四次
# StopIteration

2.2 应用案列

def my_range(start,stop,step=1):
    print('start...')
    while start < stop:
        yield start
        start+=step
    print('end....')


g=my_range(1,5,2) 
print(next(g))	# start...
				# 1
print(next(g))	# 3
print(next(g))	# end....
				# StopIteration

for n in my_range(1,7,2):
    print(n)
# start...
# 1
# 3
# 5
# end....

2.3 总结yield

有了yield关键字，我们就有了一种自定义迭代器的实现方式。yield可以用于返回值，但不同于return，函数一旦遇到return就结束了，而yield可以保存函数的运行状态挂起函数，用来返回多次值

tips

len('aaa') # 'aaa'.__len__()
next(g)    # g.__next__()
iter(可迭代对象)     # 可迭代对象.__iter__()

3 yield表达式

3.1 x=yield

def dog(name):
    print('道哥%s准备吃东西啦...' %name)
    while True:
        # x拿到的是yield接收到的值
        x = yield # x = '肉包子'
        print('道哥%s吃了 %s' %(name,x))


g=dog('alex')
g.send('肉包子') # TypeError: can't send non-None value to a just-started generator
# send传给yield值之前必须初始化,即必须先执行g.send(None)或next(g)

g.send(None) 	# 等同于next(g)
# 道哥alex准备吃东西啦...

g.send(['一根骨头','aaa'])
# 道哥alex吃了 ['一根骨头', 'aaa']

g.send('肉包子')	# g.send("肉包子")相当于  next(g)+为当前的yield传入值:肉包子
# 道哥alex吃了 肉包子

g.send('一桶泔水')
# 道哥alex吃了 一桶泔水

g.close()

g.send('1111') # 报错StopIteration,关闭之后无法传值

3.2 x=yield 返回值

x=yield 返回值要将这行代码分开看,即x=yield和yield 返回值

这里的返回值是前一段代码的返回值

执行这行代码时会将send的值传入yield,赋值给x

然后执行这行下面的代码,直到遇到下一个yield

而下一个yield 返回值才是这一段代码的返回值

def dog(name):
    food_list=[]
    print('道哥%s准备吃东西啦...' %name)
    while True:
        # x拿到的是yield接收到的值
        x = yield food_list # x = '肉包子'
        print('道哥%s吃了 %s' %(name,x))
        food_list.append(x) # ['一根骨头','肉包子']



g=dog('alex')
res=g.send(None)  # next(g)
# 道哥alex准备吃东西啦...
print(res)
# []

res=g.send('一根骨头')
# 道哥alex吃了 一根骨头
print(res)
# ['一根骨头']

res=g.send('肉包子')
# 道哥alex吃了 肉包子
print(res)
# ['一根骨头', '肉包子']

def func():
    print('start.....')
    x=yield 1111  # x='xxxxx'
    print('哈哈哈啊哈')
    print('哈哈哈啊哈')
    print('哈哈哈啊哈')
    print('哈哈哈啊哈')
    yield 22222

g=func()		# 得到生成器
res=next(g)		# 初始化
print(res)		# 1111

res=g.send('xxxxx')		# 为yield传入xxxx
print(res)				# 22222