迭代器和生成器（难点）

11.1.可迭代对象（iterable）：内部实现了__iter__方法

可以被迭代满足要求的就叫做可迭代协议。

iterable：可迭代的------对应的标志

迭代概念：一个一个取值，就像for循环一样取值

字符串，列表，元组，集合，字典都是可迭代的

11.2迭代器协议(iterator)： 内部实现了__iter__，__next__方法

可以被next()函数调用并且不断返回下一个值的对象称为迭代器

所有的iterable()均可以通过内置函数iter()转变成iterator

iterator继承自iterable,iterator包含iter()和next()方法，而iterable仅仅包含iter()

迭代器的优点：如果用了迭代器，节约内存，方便操作

print(dir([1, 2].__iter__()))   # 查看列表迭代器的所有方法
print(dir([1, 2]))   #  查看列表的所有方法

print(set(dir([1, 2].__iter__()))-set(dir([1, 2])))    # 对上面两者求差集，去重
---{'__setstate__', '__length_hint__', '__next__'}

iter_l = [1, 2, 3, 4, 5, 6].__iter__()    # 后缀必须有这个
print(iter_l.__length_hint__())  # 获取迭代器中元素的长度
---6
print(iter_l.__setstate__(4))   # 根据索引指定从哪里开始迭代
---None
print(iter_l.__next__())
print(iter_l.__next__())
print(iter_l.__next__())   # 一个一个的取值
print(next(iter_l))   #  next(iter_l)和iter_l.__next__()方法一样，推荐用next(iter_l)这个
---1
---2
---3
---4

采用ｆｏｒ循环模拟可迭代机制：

li = [1,5,78,1,534,34,51,3,15,6]
lis = li.__iter__()
while True:
    try:
        print(next(lis))
    except:　　　　　　　　＃采用ｔｒｙ过滤掉报错
        break

11.3可迭代和迭代器的相同点：都可以用for循环

11.4可迭代和迭代器的不同点：就是迭代器内部多实现了一个__next__方法

11.5判断迭代器和可迭代的方法：

第一种：判断内部是不是实现了__next__方法

'__iter__' in dir(str)  # 如果__iter__在这个方法里面，就是可迭代的。

s = 'abc'
print('__iter__' in str(s))
---False

第二种：

　　　　Iterable 判断是不是可迭代对象

　　　　Iterator 判断是不是迭代器

　　　　用法：

from collections import Iterable
from collections import Iterator
s = 'abc'    # 随便给一个字符串
print(isinstance(s, Iterable))  # isinstance 判断类型的
print(isinstance(s, Iterator))
---True
---False

11.6生成器（Generator ）（难点）：

生成器就是一种迭代器，它拥有next方法而且行为与迭代器完全相同，生成器是一种普通函数语法定义的迭代器。任何包含yield语句的函数成为生成器。

我们定义一个生成器就是定义一个普通函数，但是函数里面有yield关键字，调用生成器函数时会返回一个生成器。

生成器的好处，就是一下子不会在内存中生成太多的数据

yield 生成器的运行机制：

当你问生成器要一个数时，生成器会执行，直至出现 yield 语句，生成器把yield 的参数给你，之后生成器就不会往下继续运行。当你问他要下一个数时，他会从上次的状态开始运行，直至出现yield语句，把参数给你，之后停下。如此反复直至退出函数。

yield的使用：

在python中，当你定义一个函数，使用了yield关键字时，这个函数就是一个生成器，它的执行会和其他普通的函数有很多不同，函数返回的是一个对象，而不是你平常所用return语句那样，能得到结果值。如果想取得值，那得调用next()函数

生成器的本质：就是一个迭代器

def h():
    print 'To be brave'
    yield 5

h()             # 调用h()之后，print语句并没有执行，因为它有yield表达式

我们通过next()语句让它执行。next()语句将恢复Generator执行，并直到下一个yield表达式处。比如：

def h():
    print 'Wen Chuan'
    yield 5
    print 'Fighting!'

c = h()
print(next(c))  # c. 每当调用一次迭代器的next函数，生成器函数运行到yield之处，
　　　　　　　　　　#　　返回yield后面的值且在这个地方暂停，所有的状态都会被保持住，直到下次next函数被调用，或者碰到异常循环退出。
--- Wen Chuan
---5
                        # 当我们再次调用next(c)时，会继续执行，直到找到下一个yield表达式,否则报错


def h():
    print 'Wen Chuan'
    yield 5
    print 'Fighting!'

c = h()
c.__next__()                # 这里直接调用了next，所以没有打印yield后面的值，和上面对比一下

---Wen Chuan

这里多取值会直接报错：

def func():
    print('aaaaaaaaaaa')
    a = 1
    yield a
    print('bbbbbb')
    yield 12  # 返回第二个值

ret = func()    # 得拿到一个生成器
print(ret)      # 返回的是一个地址
print(next(ret))    # 取第一个值,'aaaaaa', 1
print(next(ret))    # 取第二个值, 'bbb', 12
print(next(ret))    # 取第三个值，会报错，因为没有yield第三个值
#注意，这里如果直接连续print(next(func())),一直只会打印第一个yield的内容，注意这里的区别。
这和上面ret是两个不同的生成器。

例：创建斐波那契数列：

def fib(max):
    （a, b） = （1, 1）
    while a < max:
        yield a      # generators return an iterator that returns a stream of values.
       (a, b)  = (b, a+b)

for n in fib(15):
    print(n)

程序运行到yield这行时，就不会继续往下执行。而是返回一个包含当前函数所有参数的状态的iterator对象。
目的就是为了第二次被调用时，能够访问到函数所有的参数值都是第一次访问时的值，而不是重新赋值。

程序第一次调用时：
def fib(max):
    (a, b） = （1, 1）
    while a < max:
        yield a      #  这时a,b值分别为1,1，当然，程序也在执行到这时，返回
        （a, b） = （b, a+b）

程序第二次调用时：
    从前面可知，第一次调用时，a,b=1,1，那么，我们第二次调用时（其实就是调用第一次返回的iterator对象的next()方法），程序跳到yield语句处，
执行a,b = b, a+b语句，此时值变为：（a,b = 1, (1+1)） => (a,b = 1, 2)
程序继续while循环，当然，再一次碰到了yield a 语句，也是像第一次那样，保存函数所有参数的状态，返回一个包含这些参数状态的iterator对象。
等待第三次的调用....

# 通过类的方法来实现斐波那契数列
class Fib:  
    def __init__(self, max):  
        self.max = max  
    def __iter__(self):  
        self.a = 0  
        self.b = 1  
        return self  
    def next(self):  
        fib = self.a  
        if fib > self.max:  
            raise StopIteration  
        self.a, self.b = self.b, self.a + self.b  
        return fib

通过yield生成全排列：

def perm(items, n = None):  
    if n is None:  
        n = len(items)  
    for i in range(len(items)):  
        v = items[i:i+1]  
        if n==1:  
            yield v  
        else:  
            rest = items[:i] + items[i+1:]  
            for p in perm(rest, n-1):  
                yield v + p  
def comb(items, n = None):  
    if n is None:  
        n = len(items)  
    else:  
        for i in range(len(items)):  
            v = items[i:i+1]  
            if 1 == n:  
                yield v  
            else:  
                rest = items[i+1:]  
                for c in comb(rest, n-1):  
                    yield v + c

11.6.1 列表推导式和生成器表达式

1.把列表解析的[]换成()得到的就是生成器表达式

2.列表解析与生成器表达式都是一种便利的编程方式，只不过生成器表达式更节省内存

3.Python不但使用迭代器协议，让for循环变得更加通用。大部分内置函数（sum，sorted，math等），也是使用迭代器协议访问对象的。例如， sum函数是Python的内置函数，该函数使用迭代器协议访问对象，而生成器实现了迭代器协议，所以，我们可以直接这样计算一系列值的和：

#列表解析
sum([i for i in range(100000000)])#内存占用大,机器容易卡死    不要运行，千万不要运行
 
#生成器表达式
sum(i for i in range(100000000))#几乎不占内存    

# 使用sorted函数
>>>sorted(x**2 for x in range(4))
[0,1,4,9]

列表推导式链接------ http://www.cnblogs.com/LearningOnline/p/8463906.html

# 注意：对于生成器

g = (i for i in range(2))
print(list(g))
print(list(g))

---[0, 1]
---[]

这里为什么第二次再次打印为空了呢？它其实只能被调用一次，第一次调用完第二次调用的时候就没有了。生成器，生成器并不会二次生成，一次使用完就不会再有第二次了

见这么个面试题：

def demo():
    for i in range(4):
        yield i

g=demo()

g1=(i for i in g)
g2=(i for i in g1)

print(list(g1))
print(list(g2))

11.6.2 yield from（两个例子结果相同，比较一下两者区别）

def func():
    yield from 'AB'
    yield from [1, 2, 3]

g = func()
print(list(g))

②
def func():
    for i in 'AB':
        yield i
    for i in [1, 2, 3]:
        yield i

g = func()
print(list(g))