python3-知识扩展扫盲易忘-generator的用法

前部分转自:

https://www.cnblogs.com/Tsukasa/p/6613934.html

通过列表list生成器,我们可以直接创建一个列表

1
2
3
>>> x = list(range(1,11))
>>> x
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

  但是,受到内存的限制,列表的容量是有限的,而且创建一个包含100万1个亿的列表时候,不仅会占用很大的储存空间,如果有事我们只要访问前面几个元素,那后面大多数元素都白白浪费了。而且运作效率低下。
  如果列表元素可以按某种算法推算出来,那我们是否可以在循环的过程中不断推算出后面的元素呢?这样就不必要创建一个完整的list列表了,从而提升程序的效率。在python中,这种一边循环一边计算的机制,称为生成器generator

  要创建一个generator,有很多方法:

第一种方法很简单,就是只要把一个列表生成试的  [ ]  改成 ( ) 就可以创建一个generator:

1
2
3
4
5
6
>>> l = [x * x for x in range(10)]
>>> l
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
>>> g = (x * x for x in range(10))
>>> g
<generator object <genexpr> at 0x00000000035BC410>

L 是一个list, 而 G 是一个generator:它们在创建时候最基本的不同就list是 [ ] ,而generator是 ( ) 。

我们可以直接打印出list的全部元素,但是怎么打印出generator的全部元素呢?

1
2
>>> g
<generator object <genexpr> at 0x00000000035BC410>

  如果要一个个打印出来,可以通过next()函数来获得generator的下一个返回值。

  

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
>>> next(g)
0
>>> next(g)
1
>>> next(g)
4
>>> next(g)
9
>>> next(g)
16
>>> next(g)
25
>>> next(g)
36
>>> next(g)
49
>>> next(g)
64
>>> next(g)
81
>>> next(g)
Traceback (most recent call last):
  File "<pyshell#18>", line 1, in <module>
    next(g)
StopIteration

    generator保存的是算法,每次调用 next(g)的时候才会计算 g 的下一个元素值,直到计算到最后一个元素,没有下一个元素时,会返回stopIteration的错误。

当然,上面这种不停调用next (g)这种方法实在是太繁琐了,正确的方法是使用for循环,因为generator也是一个可迭代对象:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
>>> g = (x * x for x in range(10))
>>> for n in g:
...     print(n)
...
0
1
4
9
16
25
36
49
64
81

jieba的cut_for_search输出可以按:

seg_list = jieba.cut_for_search("你好明天")

print(",".join(seg_list)) seglist 为generator

原文地址:https://www.cnblogs.com/NPC-assange/p/10528287.html