Python-各种结构解析以及生成器（列表解析，字典解析，集合解析，元组构成的生成器）

1、列表解析：

　　* 举例：生成一个列表，元素0-9，对每一个元素自增1后求平方返回新列表。

1 test = [ (i + 1) ** 2 for i in range(10)]
2 print(test) # [1, 4, 9, 16, 25, 36, 49, 64, 81, 100]
3 
4 
5 test = []
6 for i in range(10):
7     test.append((i + 1) ** 2)
8 print(test) # [1, 4, 9, 16, 25, 36, 49, 64, 81, 100]

　　可以看出，是将一个for循环拉平，放到一个列表中。（不是简单的拉平！！）

　　* 语法：　　

- [ 返回值 for 元素 in 可迭代带对象 if 条件 ]

- 使用中括号 [] ，内部是for 循环，if条件语句可选
- 返回一个列表

　　* 列表解析式是一种语法糖：

- 编译器会优化，不会因为简写而影响效率，反而因优化提高了效率
- 减少程序员工作量，减少出错
- 简化了代码，但是可读性增强

 1 # newlist = [print(i,end='') for i in range(10)]
 2 print(newlist)
 3 # 0123456789[None, None, None, None, None, None, None, None, None, None]
 4 # print是打印，并不是解析式生成的值，只不过没循环一次，列表中追加一个None而已
 5 
 6 newlist = [] 
 7 for i in range(10):
 8     print(i, end='')
 9     newlist.append(None)
10 print(newlist)
11 
12 #0123456789[None, None, None, None, None, None, None, None, None, None]
13 
14 
15 # 获取10以内的偶数
16 # lst = [ i for i in range(10) if not i % 2]
17 # print(lst) # [0, 2, 4, 6, 8]
18 # lst = [ i for i in range(10) if  i % 2 == 0]
19 # print(lst) # [0, 2, 4, 6, 8]

 1 lst = [i for i in range(21) if not i % 2 if not i % 3]
 2 print(lst) # [0, 6, 12, 18]
 3 lst = [i for i in range(21) if  i % 2 == 0 if i % 3 == 0]
 4 print(lst) # [0, 6, 12, 18]
 5 
 6 lst = [i for i in range(21) if not i % 2 elif not i % 3]
 7 print(lst) # 这样是会抛SyntaxError异常
 8 
 9 
10 lst = []
11 for i in range(21):
12     if i % 2 ==0:
13         lst.append(i)
14     elif i % 3 == 0:
15         lst.append(i)
16 print(lst)
17 # [0, 2, 3, 4, 6, 8, 9, 10, 12, 14, 15, 16, 18, 20]
18 首先，结果不满足，其次，如果有elif 同一层的语句，是不能写成如上的解析式的。
19 
20 lst = []
21 for i in range(21):
22     if i % 2 ==0 and i % 3 == 0:
23         lst.append(i)
24 print(lst) # [0, 6, 12, 18]
25 
26 #-------->
27 
28 lst = [ i for i in range(21) if not i % 2 and  i % 3 ==0]
29 print(lst) # [0, 6, 12, 18]
30 
31 
32 lst = [ i for i in range(21) if not i % 2 or  i % 3 ==0]
33 print(lst) # [0, 2, 3, 4, 6, 8, 9, 10, 12, 14, 15, 16, 18, 20]

举例

1 lst = [i for i in range(21) if  i % 2 == 0 if i % 3 == 0] # 在第一个if下执行第二个if
2 lst = [ i for i in range(21) if not i % 2 and  i % 3 ==0] # 直接将两个if 条件合并
3 # 这两个是等价的

　　注：循环条件都是一层一层的，第一层for下，执行第二层for，以此类推。

 1 t1 = [[x,y] for x in 'abced' for y in range(3)]
 2 print(t1)
 3 # [['a', 0], ['a', 1], ['a', 2], ['b', 0], ['b', 1], ['b', 2], ['c', 0], ['c', 1], ['c', 2], ['e', 0], ['e', 1], ['e', 2], ['d', 0], ['d', 1], ['d', 2]]
 4 
 5 t2 = [{x,y} for x in 'abced' for y in range(3)]
 6 print(t2) 
 7 # [{0, 'a'}, {1, 'a'}, {2, 'a'}, {0, 'b'}, {1, 'b'}, {2, 'b'}, {0, 'c'}, {1, 'c'}, {2, 'c'}, {0, 'e'}, {1, 'e'}, {2, 'e'}, {0, 'd'}, {1, 'd'}, {2, 'd'}]
 8 
 9 t2 = [{x:y} for x in 'abced' for y in range(3)]
10 
11 # [{'a': 0}, {'a': 1}, {'a': 2}, {'b': 0}, {'b': 1}, {'b': 2}, {'c': 0}, {'c': 1}, {'c': 2}, {'e': 0}, {'e': 1}, {'e': 2}, {'d': 0}, {'d': 1}, {'d': 2}]

举例-陷阱

 1 t1 = [(i, j) for i in range(7) if i > 4 for j in range(20,25) if j > 23]
 2 print(t1) 
 3 # 相比下面的两种个，这个效率略有提高，先比较，在进入下一次循环，但是也没什么事
 4 
 5 t2 = [(i, j) for i in range(7) for j in range(20,25)if i > 4 if j > 23]
 6 print(t2)
 7 
 8 t3 = [(i, j) for i in range(7) for j in range(20,25)if i > 4 and j > 23]
 9 print(t3)
10 
11 # [(5, 24), (6, 24)]
12 # [(5, 24), (6, 24)]
13 # [(5, 24), (6, 24)]

分析三种不同顺序的结果

　　* 练习题：

　　　　　3、打印九九乘法表

　　　　　4、'0001.ababsdgcfe' 这样的id ，从0001 - 0100　

 1 lst = [i **2 for i in range(1, 11)]
 2 
 3 
 4 lst = [1,2,3,4,5]
 5 newlist = [lst[i] + lst[i + 1]  for i in range(len(lst) - 1)]
 6 print(newlist) # [3, 5, 7, 9]
 7 
 8 
 9 cf = [ print('{}*{}={:<2}'.format(j, i, i * j), end='
' if i == j else ' ') for i in range(1, 10) for j in range(1, i + 1)]
10 
11 print(cf)
12 
13 print('
'.join([' '.join(['{}*{}={:<2}'.format(j, i, i * j)  for j in range(1, i + 1)] ) for i in range(1, 10) ]))
14 
15 import random
16 alpha = bytes(range(97,122)).decode()
17 
18 # lst = ['{:04}.{}'.format(i,''.join([random.choice(alpha) for _ in range(10)])) for i in range(1, 101)]
19 # print(lst)
20 
21 l = random.choices(alpha,k = 10) #  ['u', 't', 'h', 'x', 'v', 'g', 'c', 'p', 'l', 'n']
22 s1 = ''.join(l)
23 
24 l = ''.join(random.sample(alpha,10)) # 如果用sample的话，就没有重复的字母，上面的choice 或choices是有重复字母的可能性的
25 print(l)

program

 1 1*1=1 
 2 1*2=2  2*2=4 
 3 1*3=3  2*3=6  3*3=9 
 4 1*4=4  2*4=8  3*4=12 4*4=16
 5 1*5=5  2*5=10 3*5=15 4*5=20 5*5=25
 6 1*6=6  2*6=12 3*6=18 4*6=24 5*6=30 6*6=36
 7 1*7=7  2*7=14 3*7=21 4*7=28 5*7=35 6*7=42 7*7=49
 8 1*8=8  2*8=16 3*8=24 4*8=32 5*8=40 6*8=48 7*8=56 8*8=64
 9 1*9=9  2*9=18 3*9=27 4*9=36 5*9=45 6*9=54 7*9=63 8*9=72 9*9=81
10 
11 
12 ['0001.lkbjmbfcwj', '0002.ciebvklpie', '0003.sjwtcakjjk', '0004.kuiivvfoai', '0005.ymaetkbdrt', '0006.ayhlrgedoh', '0007.xdjnaysdct', '0008.qkakrtdebv', '0009.jytyhtnwkc', '0010.rbxkiuetev', '0011.plhdxcdyvq', '0012.ubkudcrisb', '0013.yoceaqjvna', '0014.aeirhriutw', '0015.yemotxgfin', '0016.tehmlunsgy', '0017.seobircuxq', '0018.nxofutxipl', '0019.lbtmvkrhnj', '0020.rowntjaqpp', '0021.oadngppkty', '0022.ftdeifipph', '0023.fwuxgxgovt', '0024.bjnaxoqsxd', '0025.jhkjanttrr', '0026.eoutbjinyq', '0027.agdidptkcu', '0028.ccofruyutd', '0029.suchksvbva', '0030.ucvrshekrf', '0031.qikrlpilqi', '0032.ffdfqosxnh', '0033.jtotgqsdgm', '0034.jxssbjnclg', '0035.qandynxfat', '0036.ygodstktip', '0037.qklhxypdba', '0038.vlghicldkp', '0039.jbpyieqxkc', '0040.dcybelgsew', '0041.bumewnipnp', '0042.koqdtxfain', '0043.wpjdhnduah', '0044.vledqpcnpd', '0045.bkjisgagaj', '0046.ymdthjiphw', '0047.avqxthoilm', '0048.wsxtulxfnl', '0049.tmvdcqovcf', '0050.jcfnuaqfob', '0051.tpptnvysyv', '0052.bsmfywydnw', '0053.ivqotuhhgp', '0054.nfryeqntta', '0055.eyoxwwtuhl', '0056.hgtnxluwqy', '0057.buabekigsu', '0058.dxbflmyknn', '0059.bibmwmoitm', '0060.mmbyibfeeg', '0061.ulythfirrd', '0062.rnamiseafs', '0063.abpbtceqpd', '0064.fawoscqiub', '0065.aunqntadxh', '0066.owavtvxdrq', '0067.ahnioayayy', '0068.ojbuyqvmxf', '0069.svbqsppkes', '0070.ncqojtdtlg', '0071.hmbtvsuwah', '0072.iwqykfsisp', '0073.fymolgcbnh', '0074.txhnidqufy', '0075.icmhrnifjx', '0076.dvctqrjyhe', '0077.nqncmelbys', '0078.gbaqnpaxyy', '0079.gfirdjcrao', '0080.qcguhuqdwk', '0081.kuqellfomi', '0082.kpltlguvcc', '0083.lfeserogau', '0084.imgwnglrob', '0085.dvtcjupmmk', '0086.evswireebh', '0087.tlbordvirb', '0088.eleixowhur', '0089.mvpwqiottn', '0090.iokdlfvipt', '0091.tqeuiulywc', '0092.twrfdissos', '0093.ylbtevnroy', '0094.uvtifqqdny', '0095.kxrhorowny', '0096.qcygokxvys', '0097.gvlufbmctq', '0098.jmqgjidgxv', '0099.gxvbreoimr', '0100.ljjjoelvna']

answer

2、生成器表达式：

　　定义：

　　　　生成器就是迭代器，可以理解为一种数据类型，这种数据类型实现了迭代器协议，其他的数据类型需要调用自己内置的__iter_方法，所以生成器就是可迭代对象。

　　生成器分类以及在Python中的表现形式：（Python有两种不同的方式提供生成器）

　　　　①生成器函数：常规函数定义，但是，使用yield 语句代替return语句，但是，yield在同一层函数中，可以多次使用，一次返回一个结果，返回一个结果后，将函数设置为挂起状态，以便下次从他离开的地方继续执行。

　　　　②生成器表达式：类似于列表的推导，但是生成器返回按需产生结果的一个对象，而不是一次性构建一个结果列表。

　　语法：

- （返回值 for 元素 in 可迭代对象 if 条件）
- 列表解析式的中括号换成小括号
- 返回一个生成器

　　和列表解析式的区别：

- 生成器表达式是按需计算（或惰性求值，延迟计算）需要的时候才算值。
- 列表解析式是立即返回值

　　生成器：

- 可迭代对象
- 迭代器

　　举例：　　　　

 1 g = ('{:04}'.format(i) for i in range(1,11))
 2 print(g)
 3 
 4 a = next(g)
 5 
 6 for i in g:
 7     print('i',i)
 8 print('------------------')
 9 for j in g:
10     print('j',j)
11 
12 结果：
13 # 可以看出g 是一个生成器对象 generator
14 # next(g) 表示地址指针向下走一步
15 # 第一个for循环就将g 迭代完了
16 # 所以第二个for就没法往下进行迭代
17 # 因为生成器是无法向列表那样，一致迭代，当地址指针到了最后一个后，用next() 再迭代会报错
18 <generator object <genexpr> at 0x0000000001D9D318>
19 i 0002
20 i 0003
21 i 0004
22 i 0005
23 i 0006
24 i 0007
25 i 0008
26 i 0009
27 i 0010
28 ------------------

 1 对比：列表解析式:
 2 
 3 g = ['{:04}'.format(i) for i in range(1,11)]
 4 print(g)
 5 
 6 
 7 
 8 for i in g:
 9     print('i',i)
10 print('------------------')
11 for j in g:
12     print('j',j)
13 
14 
15 ['0001', '0002', '0003', '0004', '0005', '0006', '0007', '0008', '0009', '0010']
16 i 0001
17 i 0002
18 i 0003
19 i 0004
20 i 0005
21 i 0006
22 i 0007
23 i 0008
24 i 0009
25 i 0010
26 ------------------
27 j 0001
28 j 0002
29 j 0003
30 j 0004
31 j 0005
32 j 0006
33 j 0007
34 j 0008
35 j 0009
36 j 0010

　　　　　　总结：

　　　　　　　　生成器，延迟计算（惰性求值），返回迭代器，可以迭代，从前往后走一遍，不能回头。

　　　　　　　　列表解析式：立即求值，返回的不是迭代器，是可迭代对象，从前往后走一遍后，可以回头

　　　注：

 1 it = (print('{}'.format(i + 1)) for i in range(2))
 2 
 3 first = next(it)
 4 
 5 second = next(it)
 6 
 7 val = first + second
 8 
 9 1
10 2
11 --------------------------------------------------------------------------
12 TypeError                                Traceback (most recent call last)
13 <ipython-input-10-8a69cb4a56e0> in <module>()
14       5 second = next(it)
15       6 
16 ----> 7 val = first + second
17 
18 TypeError: unsupported operand type(s) for +: 'NoneType' and 'NoneType'
19 
20 
21 # 事实上，it 生成器（generator）里边是None，print 是打印，
22 # 所以每次next(it) 的时候，要执行一次print(...)，同时将None 赋值给变量

1 it = (x for x in range(10) if x %2)
2 first = next(it)
3 second = next(it)
4 val = first + second
5 print(val) # 4

例子

　　　　生成器和列表解析式的对比：

- - 计算速度：
    - 单看计算时间看，生成器表达式好事非常短，列表解析式耗时长
    - 但是生成器本身并没有返回任何值，只返回一个生成器对象
    - 列表解析式构造并返回一个新的列表

　　　　注：

　　　　　　使用内建函数 iter() 可以将一个可迭代对象转换为一个生成器。iter([1,2,3])　　　　　　　

1 b = iter(range(4))
2 next(b) # 一直是0 ，因为每next一次，从新建一个生成器，所以一直在0的位置
3 
4 a = iter(range(4))
5 for i in a :
6     print(i) # 0,1,2,3,

　　　　　　迭代器没有 len（）这个attribution

3、集合解析式 Python3.x新增

　　　　语法：

- - { 返回值 for 元素 in 可迭代对象 if 条件}
  - 列表解析式的中括号，换位大括号
  - 立即返回一个集合

　　　　用法：

- - { (x, x + 1) for i in range(10) }
  - { [x] for x in range(10)} # 这个会报错，[x ] ,集合中不能有不可hash的

4、字典解析：Python3 新增

　　　　语法：

- - { 返回值 for 元素 in 可迭代对象 if 条件}
  - 使用 k-v 形式
  - 立即返回一个字典

　　　　用法：　　　　　　

 1 a = {x:(x, x + 1) for x in range(4)}
 2 print(a) # {0: (0, 1), 1: (1, 2), 2: (2, 3), 3: (3, 4)}
 3 b = {x:[x, x + 1] for x in range(4)}
 4 print(b) # {0: [0, 1], 1: [1, 2], 2: [2, 3], 3: [3, 4]}
 5 c = {(x,):[x, x + 1] for x in range(4)}
 6 print(c) # {(0,): [0, 1], (1,): [1, 2], (2,): [2, 3], (3,): [3, 4]}
 7 d = {[x]:[x, x + 1] for x in range(4)}
 8 print(d) # TypeError
 9 e = {chr(0x41 + x):x ** 2 for x in range(4)}
10 print(e) # {'A': 0, 'B': 1, 'C': 4, 'D': 9}
11 f = {str(x):y  for x in range(4) for y in range(3)}
12 print(f) # {'0': 2, '1': 2, '2': 2, '3': 2}  覆盖
13

test

5、总结：

　　——生成器相对解析式而言，生成器主要节省了内存，事实上，效率上并没有明显的提高，所以一般只考虑内存问题就可以。

　　——Python2 映入列表解析式

　　——Python2.4 引入生成器表达式

　　——Python3 引入集合，字典解析式，并迁移到2.7

　　——一般来说，应该多用解析式，简短，高效，如果一个解析式非常复杂，要考虑拆解用for循环

　　——生成器和迭代器是不同的对象，但是都可迭代对象，迭代器可以用next()

　　　　——生成器是迭代器，迭代器不一定是生成器， iter(range(4)) 不是生成器生成的

为什么要坚持，想一想当初！