python——生成器

1.什么是生成器：可以理解为一种数据类型，这种数据类型实现了迭代器协议(其他的数据类型需要调用自己内置的__iter__ 方法)，所以生成器就是可迭代对象

2.生成器分类在python中的表现形式：（python有两种不同的方式提供生成器）

　　（1）生成器函数：常规函数定义，但是，使用yield语句而不是return语句返回结果。yield语句一次返回一个结果，在每个结果中，挂起函数的状态，以使下次从他离开的地方继续执行

def test():
    print('开始生孩子了')
    yield '我'
    print('开始生儿子了')
    yield '儿子'
    yield '孙子'


res = test()　　　　　　　　　　　　　　　　　　　　　　　　　 　　res调用了次函数，此时res就相当于一个生成器，支持__next__方法，同时也可以用for循环去遍历它 即 for i in res：print（i） 会将所有内容打印（生孩子---孙子）　　　　　　　　
print(res)
print(res.__next__())　　　　　　　　　　　　　　
print(res.__next__())
运行结果：
<generator object test at 0x00000198BF0A30F8>　　　　　　　 调用函数，相当于返回一个地址  （生成器）   需要通过res.__next__()来显示
开始生孩子了　　　　　　　　　　　　　　　　　　　　　　　　　　　
我
开始生儿子了
儿子　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　从运行结果可以得知，yield返回了一个值，相当于return，其与return不同之处在于yield会保存当前函数的运行状态，所以第二次运行print（res.__next__()）
　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　是从print（‘开始生儿子了’）开始，并在yield ‘儿子’  处停止并返回值

　　　　　　卖包子实例

def pro_baozi():
    for i in range(100):
        print('正在生产包子')
        yield '第 %s屉包子生产出来了' %i
        print('
')
        print('第 %s屉包子卖出去了'%i)

pro_g = pro_baozi()　　　　　　　　　　　　　　　pro_g调用了函数，此时pro_g就可看作是一个生成器，此时它支持__next__方法
baozi1 =print(pro_g.__next__())
baozi1 =print(pro_g.__next__())
baozi1 =print(pro_g.__next__())
运行结果：
正在生产包子
第 0屉包子生产出来了　　　　　　　　函数运行到第一个 yield 暂停并返回值，第二次运行从当前位置开始直到再一次碰到 yield 暂停并返回值
　　　　　　　　　　　　　　　　　　此处开始到下一次换行前是第二次调用的结果，因为yield会保留函数的运行状态，所以在第二次调用后，先执行print（'
'）,因为print自带换行，因此执行此语句换行了两次

第 0屉包子卖出去了
正在生产包子
第 1屉包子生产出来了


第 1屉包子卖出去了
正在生产包子
第 2屉包子生产出来了

　　（2）生成器表达式：类似于列表推导，但是，生成器返回按需产生结果的一个对象，而不是一次构建一个结果列表

　　　　三元表达式

name = '焦国华'
res = '帅哥'   if name == '焦国华'  else  '沙雕'　　　　　　　　这种形式就是三元表达式    res = True if 条件  else False
print(res)　　
运行结果：

帅哥

　　　　列表解析

l = ['鸡蛋%s' %i for i in range(10)]      这种形式就称为列表解析，实际上也是[ ]内是一个二元表达式   也可以写为 l = ['鸡蛋%s' %i for i in range(10)  if i >5]   运行输出['鸡蛋 0', '鸡蛋 1', '鸡蛋 2', '鸡蛋 3', '鸡蛋 4']
print(l)
运行结果：['鸡蛋0', '鸡蛋1', '鸡蛋2', '鸡蛋3', '鸡蛋4', '鸡蛋5', '鸡蛋6', '鸡蛋7', '鸡蛋8', '鸡蛋9']

　　　　总结：

　　　　（1）生成器表达式把列表解析的 [ ] 换成（）得到的就是生成器表达式

laomuji = ('鸡蛋%s' %i for i in range(10))　　　　此处只是获取了一个生成器，laomuji是一个内存地址，只有再对其进行迭代操作才会输出值，不像三元表达式一样
print(laomuji)
print(laomuji.__next__())
print(laomuji.__next__())
运行结果：
<generator object <genexpr> at 0x000001AFF8B8F048>
鸡蛋0
鸡蛋1

　　　　（2）列表解析与生成器表达式都是一种便利的编程方式，只不过生成器表达式更节省内存

　　　　（3）python不但使用迭代器协议，让for循环变得更加通用。大部分内置函数，也是用迭代器协议访问对象。例如，sum函数是python的内置函数，该函数使用迭代器协议访问对象，而生成器实现了

　　　　　　迭代器协议，所以，我们可以直接这样计算一系列值的和：

sum(x ** 2   for x in range(4))　　　　　　即内部可以直接写一个生成器表达式，因为生成器表达式满足迭代器协议

def get_pop():
    with open('人口普查','r',encoding = 'utf8') as f:
        for i in f:
            yield i

g = get_pop()
all_pop = sum(eval(i)['population']    for i in g)　　　　　　　　生成器表达式，前边的是要相加的数。 for i in g 拿到的是字符串形式如‘{'name': '北京','population':'131'}’，通过eval函数
　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　使其变成对应的字典形式，在通过key索引，得到人口数，进而进行相加

　　　　而不用多此一举先构造一个列表

sum([x ** 2   for x in range(4)])

3.生成器总结：

　　（1）语法上和函数类似：生成器函数和常规函数几乎是一样的，他们都是使用def语句进行定义，差别在于，生成器使用 yield 语句返回一个值，而常规函数使用 return 语句返回一个值

　　（2）自动实现迭代器协议：对于生成器，python会自动实现迭代器协议，以便应用到迭代背景中（如for循环、sum（）函数）。由于生成器自动实现了迭代器协议，所以，我们可以调用它的__next__

　　　　方法，并且，在没有值可以返回的时候，生成器自动生成StopIteration异常

　　（3）状态挂起：生成器使用yield语句返回一个值，yield语句挂起该生成器函数的状态，保留足够的信息，以便之后从离开他的地方继续执行

优点：：（1）生成器的好处是延时计算，一次返回一个结果。也就是说，它不会一次生成所有的结果，这回与大数据量处理将会非常有用

　　　　（2）生成器还能有效提高代码可读性

　　（4）生成器只能遍历一次