day14: 生成器进阶

1，复习，迭代器：双下方法很少直接调用，一般都是通过其他语法触发的；迭代器一定可迭代，可迭代的通过调用iter()方法皆可以得到一个迭代器.

迭代器很方便使用，所有的数据只可以取一次，节省内存空间。生成器的本质就是迭代器，调用生成器函数之后，函数并不执行，而是返回一个生成器，

每次调用next方法会返回一个值，知道取完最后一个，在去取会报错

2，作业，写生成器实现：有一个文件，从文件里分段读取内容，在读取出来的内容前加上***返还给调用者，这个作业其实是给网络编程做铺垫

使用readline或者read(1024)实现

3，网络编程的时候，比方说发送一个视频，都是一点一点的发，一点一点的收，但是我们收发的时候，也不是直接就可以发的，都要做一点包装，这儿就会用到生成器。

4，从生成器取值的三个方法：next；for；数据类型的强制转换，这种会占用内存，完全体现不了生成器的初衷（有的面试题会在这儿出题），一般不用

5，使用生成器的核心就是，这个生成数据的过程，可能会被别人反复的使用，所以要封装成函数，但是我们不能把我们要使用的数据都生成了再返回，所以这儿我们用到了生成一条，返回一条，所以我们用到了yield。

6，最后一个yield的后面的代码是拿不到的，使用for可以，next是不可以的

def generator():
    print(123)
    yield 'a'
    print(456)
    yield 'b'
    print(789)

g = generator()
for i in g:  # yield 后面的数据，for循环是可以拿到的，但是，使用next是拿不到的，最后一个会报错
    print(i)

运行结果：
123
a
456
b
789

def generator():
    print(123)
    yield 'a'
    print(456)
    yield 'b'
    print(789)

g = generator()
print(g.__next__())
print(g.__next__())
print(g.__next__())

运行结果：
123
Traceback (most recent call last):
a
456
  File "/Users/guolixiao/PycharmProjects/lisa's_practise/boys/14.1.py", line 20, in <module>
b
    print(g.__next__())
789
StopIteration

7，这里老师有引入了另外一种访问yield的方式，send，必须有一个参数。

def generator():
    print(123)

    num1 = yield 'a'  # 第一次 next之后，会执行到yield抛出'a'，然后停在这里知道给num1赋值，这儿如果不send的话，num1默认是None
    print(num1)
    print(456)

    num2 = yield 'b' # 执行完send之后，"hello"字符串赋值给num1同时执行到第二个yield抛出'b',然后等在这里给num2 赋值
    print(num2)
    print(789)

g = generator()
print('***',g.__next__())
print('***',g.send("hello"))  # 只是这样看的话，send的效果next是一样的

8，结论：send获取下一个值的效果和next是一致的，只是在获取下一个值的时候，给上一个yield的位置传递一个数据

9，使用send注意事项：第一次使用的时候，必须使用next获取下一个值，也就是激活一下，最后一个yield不能接收外部的值

10，如果最后一个yield下面如果确实还有代码要执行，但是没有什么值要返回了，怎么办呢，在最后再加一个yield，然后再支撑我做一次next或者send就行了。

def generator():
    print(123)

    num1 = yield 'a'  # 第一次 next之后，会执行到yield抛出'a'，然后停在这里知道给num1赋值，这儿如果不send的话，num1默认是None
    print(num1)
    print(456)

    num2 = yield 'b' # 执行完send之后，"hello"字符串赋值给num1同时执行到第二个yield抛出'b',然后等在这里给num2 赋值
    print(num2)
    print(789)
    yield   # 最后会多出来一个none其实就是这个空yield抛出来的


g = generator()
print('***',g.__next__())
print('***',g.send("hello"))  # 只是这样看的话，send的效果next是一样的
# print(g.send("world"))
print(g.__next__())  # 最后在加的那个yield支撑我在做一次next或者send

11，相对与yield和next，这个send其实用的相对少，next和for，和使用列表取值是必会的，send也要求知道，作用范围和next是一样的，如果不需要往生成器传值，next就可以了，只有我要拿的值，依赖于我往里传的值，才用send。

12，一个例子：获取移动平均值，send不可以在第一个用，第一个必须是next，一个循环里面只可以有一个yield，遮掩才能保证每次send 一次会产生一个新的值

def ava_sum():

    num = 0
    sum = 0
    count = 0
    ava_num = 0
    while True:
        num = yield ava_num
        count += 1
        sum += num
        ava_num = sum/count



g = ava_sum()
g.__next__()
ret = g.send(5)
print(ret)

ret = g.send(10)
print(ret)

ret = g.send(3)
print(ret)

ret = g.send(2)
print(ret)

运行结果：
5.0
7.5
6.0
5.0

13，由于上面的移动平均值生成器函数，每次一开始要用一次next激活一下，这有点不友好，我希望一拿到这个函数，就可以直接send了，怎么办？解释器

# 预激生成器功能的装饰器
def init(f):  
    def inner(*args,**kwargs):
        g = f(*args,**kwargs)
        g.__next__()  # 只需要加一句这个就可以了
        return g
    return inner

@init
def ava_sum():

    num = 0
    sum = 0
    count = 0
    ava_num = 0
    while True:
        num = yield ava_num
        count += 1
        sum += num
        ava_num = sum/count

g = ava_sum()
ret = g.send(5)
print(ret)

ret = g.send(10)
print(ret)

ret = g.send(3)
print(ret)

ret = g.send(2)
print(ret)

运行结果：
5.0
7.5
6.0
5.0

14，上面多了一个装饰器，下面少些了一个next，因为所有跟send相关的都要激活才可以，加上同一个装饰器就可以少些很多部，对于用户来说就更直观了。用户使用时更方便了

15，python3里面新加入一个知识点，yield from用在生成器函数里面，从容器类型里面一个一个取值。

def generator():
    a = '12345'
    yield from a
    b = 'abcde'
    yield from b

# 同一个生成器，每个值只可以取一次
# yield from会把所有制打散来取
g = generator()
print(g.__next__())
print('================')
for i in g:
    print(i)


运行结果：
1
================
2
3
4
5
a
b
c
d
e

def generator():
    a = '12345'
    yield a
    b = 'abcde'
    yield b

# 同一个生成器，每个值只可以取一次
# yield from会把所有值打散来取
g = generator()
print(g.__next__())
print('================')
for i in g:
    print(i)

运行结果：
12345
================
abcde

16，我们还可以这样来写，但是不推荐

def generator():
    a = '12345'
    for i in a:
        yield i
    b = 'abcde'
    for i in b:
        yield i

# 同一个生成器，每个值只可以取一次
# yield from会把所有制打散来取
g = generator()
print(g.__next__())
print('================')
for i in g:
    print(i)

运行结果：
1
================
2
3
4
5
a
b
c
d
e

17，列表推导式：其实就是一种简单的语法，获取一个列表

li = ["lisa%s"%i for i in range(10)]
print(li)

#结果就是一个列表
运行结果：
['lisa0', 'lisa1', 'lisa2', 'lisa3', 'lisa4', 'lisa5', 'lisa6', 'lisa7', 'lisa8', 'lisa9']

18，上面的语法和下面的for循环，效果是一样的

li = []
for i in range(10):
    li.append('lisa%s'%i)

print(li)
运行结果：
'lisa0', 'lisa1', 'lisa2', 'lisa3', 'lisa4', 'lisa5', 'lisa6', 'lisa7', 'lisa8', 'lisa9']

19，其他的列表推导式：

li = [i*2 for i in range(10)]
print(li)
li = [i*i for i in range(10)]
print(li)
li = [i for i in range(10)]
print(li)

运行结果：
[0, 2, 4, 6, 8, 10, 12, 14, 16, 18]
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

20，生成器表达式：只要把列表推导式的中括号换成圆括号就变成了生成器表达式，不同点一，括号不一样，第二点不同，返回值不一样，一个返回列表，一个返回一个生成器，生成器表达式运行快，而且几乎不占用内存，这是他比列表表达式好的地方，用户虽然不关心这些，但是我们要关心的，表达式比较简单，并不能满足所有需求，类似三元运算符号，都是比较简单的问题，他能实现的功能，生成式函数都可以实现，一些面试题比较喜欢考这儿。

g = (i for i in range(5)) # 运行到这里只是返回了一个生成器，里面的代码并没有执行
print(g)
for i in g:
    print(i)  # 走到print，生成器里面的代码才会运行

运行结果：
<generator object <genexpr> at 0x10a1135e8>
0
1
2
3
4

21，老师把生成器比喻成了老母鸡，取值i比喻成鸡蛋，很贴切，但是实际代码，不写中文

22，带条件的生成器表达式：

# [每一个元素或者是和元素相关的操作 for 元素 in 可迭代数据]
# [每一个元素或者是和元素相关的操作 for 元素 in 可迭代数据 if 元素相关的条件]

# 30以内能被3整除的数
g = (i for i in range(30) if i%3 ==0)
for i in g:
    print(i)

运行结果：
0
3
6
9
12
15
18
21
24
27

23，找出嵌套列表中，名字含有两个字母e的名字，其实多层嵌套，并不是很常用，既要简洁，又要可读，嵌套列表其实用的并不多，要写的大家都可以看得懂，列表推导式里面的，打断点都不好使，直接就出来了，在复杂一点的话，还不如用for循环。

# 嵌套列表,前面女，后面男
li =[['Lisa','Mary','Jeniffer','Lucy'],['Tom','Steven','Jack','Wesley']]
g = (name for list_line in li for name in list_line if name.count('e')==2)
for i in g:
    print(i)

# for的顺序，先for外面的大列表，再for里面的小列表

24，字典推导式和集合推导式，这两个了解就行了，但是前面的列表推导式是要求会的

# 字典表达式，需要用大括号括起来

# 例一：要求将上面的字典key 和value对调，生成新的字典
my_dict = {'a':20,'b':10,'c':30}
my_new_dict = {my_dict[k]:k  for k in my_dict}
print(my_new_dict)

# 例二：合并大小写对应的value值，将k统一成小写
my_dict = {'a':20,'b':10,'c':30,'A':40,'C':60}
my_new_dict = {k.lower():my_dict.get(k.lower(),0)+my_dict.get(k.upper(),0) for k in my_dict}
# get函数，可以不存在是默认抛出0

dict1 = {'a':20,'b':10}
print(dict1.get('c',0))  # 没哟这个key 的时候回抛出0

运行结果
{20: 'a', 10: 'b', 30: 'c'}
{'a': 60, 'b': 10, 'c': 90}
0

25，集合推导式，最大的作用就是去重

my_set = {x*x for x in [1,-1,2,-3,3]}
print(my_set)

运行结果：
{1, 4, 9}

26，各种推导式，两个操作，遍历操作，筛选操作，支持各种推到式，让代码更简洁，但不要写的太复杂了

27，可迭代对象，迭代器，生成器：惰性运算，生成器，一次返回一个结果，生成器我们自己写的，很明显，迭代器是Python自己写的，不明显，但是其实也是惰性的，这对于处理大数据来说是非常有用的。另外提高代码的可读性，同一个迭代器，取值只可以取一次，不找他要值，不干活。