Python中什么时候使用生成器？

编者注：本文主要参考了《Python核心编程（第二版）》

说到生成器，先说说列表解析。列表解析可以动态创建列表。

[expr for iter_var in iterable if cond_expr]

该句的核心是 for循环，它迭代了iterable对象的所有条目。如果满足cond_expr（条件表达式），则前面的expr（表达式）应用于该成员。最后生成的是满足条件的元素的该表达式的列表。对于lambda,map(),filter()等可以通过列表解析简化为一个列表解析式。 首先看看这三个函数的作用：

map(lambda x:x**2, range(6))
>>>[0, 1, 4, 9, 16, 25]

lambda 输入参数：输出表达式允许创建一行函数对象，不用def定义，简化代码
map(操作，需要操作的列表) 对所有列表成员应用一个操作

可以用列表解析来简化上面的操作：

[x**2 for x in range(6)]
>>>[0, 1, 4, 9, 16, 25]

同样也可以用列表解析来简化filter()操作，比如：

seq = [11, 10, 1, 9, 10, 2, 3, 44, 12, 11]
print filter(lambda x: x % 2, seq)
>>>[11, 1, 9, 3, 11]

可以用列表解析来简化上面的操作：

print [x for x in seq if x % 2]
>>>[11, 1, 9, 3, 11]

生成器是列表解析的一个拓展。
（expr for iter_var in iterable if cond_expr）
它与列表解析器非常相似，且语法基本相同，但不是真正创建列表而是生成一个生成器。这个生成器在每次计算出一个条目后，把这个条目“产生(yield)出来”，生成器表达式使用了“延迟计算（lazy evaluation）”,所以它使用内存上更有效。

print (x for x in seq if x % 2)
>>><generator object <genexpr> at 0x00000000025B6AB0>

那到底什么时候使用生成器呢？

当创建列表只是一共中间过程的时候，为了避免创建庞大的列表，我们可以使用生成器表达式来完成。比如，我们要计算一篇txt文本的单词数时，我们没必要先将列表生成再计算单词数。

f = open('*.txt','r')
len([word for line in f for word in line.split()]) #使用列表解析，先生成列表后计数
len(word for line in f for word in line.split())   #使用生成器，对返回的生成器计数，没有生成列表

所做的只是把方括号去掉，不但少了两个字节，更节省了内存。
这让我想起了使用xrange()代替range(),道理是一样的。xrange返回一个生成器，而range返回一个列表。