Python-各种结构解析以及生成器(列表解析,字典解析,集合解析,元组构成的生成器)

1、列表解析:

  * 举例:生成一个列表,元素0-9,对每一个元素自增1后求平方返回新列表。

1 test = [ (i + 1) ** 2 for i in range(10)]
2 print(test) # [1, 4, 9, 16, 25, 36, 49, 64, 81, 100]
3 
4 
5 test = []
6 for i in range(10):
7     test.append((i + 1) ** 2)
8 print(test) # [1, 4, 9, 16, 25, 36, 49, 64, 81, 100]

  可以看出,是将一个for循环拉平,放到一个列表中。(不是简单的拉平!!)

  

  * 语法:  

    • [ 返回值 for 元素  in 可迭代带对象 if 条件 ]
    • 使用中括号 [] ,内部是for 循环 ,if条件语句可选
    • 返回一个列表

  * 列表解析式是一种语法糖

    • 编译器会优化,不会因为简写而影响效率,反而因优化提高了效率
    • 减少程序员工作量,减少出错
    • 简化了代码,但是可读性增强
 1 # newlist = [print(i,end='') for i in range(10)]
 2 print(newlist)
 3 # 0123456789[None, None, None, None, None, None, None, None, None, None]
 4 # print是打印,并不是解析式生成的值,只不过没循环一次,列表中追加一个None而已
 5 
 6 newlist = [] 
 7 for i in range(10):
 8     print(i, end='')
 9     newlist.append(None)
10 print(newlist)
11 
12 #0123456789[None, None, None, None, None, None, None, None, None, None]
13 
14 
15 # 获取10以内的偶数
16 # lst = [ i for i in range(10) if not i % 2]
17 # print(lst) # [0, 2, 4, 6, 8]
18 # lst = [ i for i in range(10) if  i % 2 == 0]
19 # print(lst) # [0, 2, 4, 6, 8]
 1 lst = [i for i in range(21) if not i % 2 if not i % 3]
 2 print(lst) # [0, 6, 12, 18]
 3 lst = [i for i in range(21) if  i % 2 == 0 if i % 3 == 0]
 4 print(lst) # [0, 6, 12, 18]
 5 
 6 lst = [i for i in range(21) if not i % 2 elif not i % 3]
 7 print(lst) # 这样是会抛SyntaxError异常
 8 
 9 
10 lst = []
11 for i in range(21):
12     if i % 2 ==0:
13         lst.append(i)
14     elif i % 3 == 0:
15         lst.append(i)
16 print(lst)
17 # [0, 2, 3, 4, 6, 8, 9, 10, 12, 14, 15, 16, 18, 20]
18 首先,结果不满足,其次,如果有elif 同一层的语句,是不能写成如上的解析式的。
19 
20 lst = []
21 for i in range(21):
22     if i % 2 ==0 and i % 3 == 0:
23         lst.append(i)
24 print(lst) # [0, 6, 12, 18]
25 
26 #-------->
27 
28 lst = [ i for i in range(21) if not i % 2 and  i % 3 ==0]
29 print(lst) # [0, 6, 12, 18]
30 
31 
32 lst = [ i for i in range(21) if not i % 2 or  i % 3 ==0]
33 print(lst) # [0, 2, 3, 4, 6, 8, 9, 10, 12, 14, 15, 16, 18, 20]
举例
1 lst = [i for i in range(21) if  i % 2 == 0 if i % 3 == 0] # 在第一个if下执行第二个if
2 lst = [ i for i in range(21) if not i % 2 and  i % 3 ==0] # 直接将两个if 条件合并
3 # 这两个是等价的

  注:循环条件都是一层一层的,第一层for下,执行第二层for,以此类推。

 1 t1 = [[x,y] for x in 'abced' for y in range(3)]
 2 print(t1)
 3 # [['a', 0], ['a', 1], ['a', 2], ['b', 0], ['b', 1], ['b', 2], ['c', 0], ['c', 1], ['c', 2], ['e', 0], ['e', 1], ['e', 2], ['d', 0], ['d', 1], ['d', 2]]
 4 
 5 t2 = [{x,y} for x in 'abced' for y in range(3)]
 6 print(t2) 
 7 # [{0, 'a'}, {1, 'a'}, {2, 'a'}, {0, 'b'}, {1, 'b'}, {2, 'b'}, {0, 'c'}, {1, 'c'}, {2, 'c'}, {0, 'e'}, {1, 'e'}, {2, 'e'}, {0, 'd'}, {1, 'd'}, {2, 'd'}]
 8 
 9 t2 = [{x:y} for x in 'abced' for y in range(3)]
10 
11 # [{'a': 0}, {'a': 1}, {'a': 2}, {'b': 0}, {'b': 1}, {'b': 2}, {'c': 0}, {'c': 1}, {'c': 2}, {'e': 0}, {'e': 1}, {'e': 2}, {'d': 0}, {'d': 1}, {'d': 2}]
举例-陷阱
 1 t1 = [(i, j) for i in range(7) if i > 4 for j in range(20,25) if j > 23]
 2 print(t1) 
 3 # 相比下面的两种个,这个效率略有提高,先比较,在进入下一次循环,但是也没什么事
 4 
 5 t2 = [(i, j) for i in range(7) for j in range(20,25)if i > 4 if j > 23]
 6 print(t2)
 7 
 8 t3 = [(i, j) for i in range(7) for j in range(20,25)if i > 4 and j > 23]
 9 print(t3)
10 
11 # [(5, 24), (6, 24)]
12 # [(5, 24), (6, 24)]
13 # [(5, 24), (6, 24)]
分析三种不同顺序的结果

  

  * 练习题:

     3、打印九九乘法表

     4、'0001.ababsdgcfe' 这样的id ,从0001 - 0100 

 1 lst = [i **2 for i in range(1, 11)]
 2 
 3 
 4 lst = [1,2,3,4,5]
 5 newlist = [lst[i] + lst[i + 1]  for i in range(len(lst) - 1)]
 6 print(newlist) # [3, 5, 7, 9]
 7 
 8 
 9 cf = [ print('{}*{}={:<2}'.format(j, i, i * j), end='
' if i == j else ' ') for i in range(1, 10) for j in range(1, i + 1)]
10 
11 print(cf)
12 
13 print('
'.join([' '.join(['{}*{}={:<2}'.format(j, i, i * j)  for j in range(1, i + 1)] ) for i in range(1, 10) ]))
14 
15 import random
16 alpha = bytes(range(97,122)).decode()
17 
18 # lst = ['{:04}.{}'.format(i,''.join([random.choice(alpha) for _ in range(10)])) for i in range(1, 101)]
19 # print(lst)
20 
21 l = random.choices(alpha,k = 10) #  ['u', 't', 'h', 'x', 'v', 'g', 'c', 'p', 'l', 'n']
22 s1 = ''.join(l)
23 
24 l = ''.join(random.sample(alpha,10)) # 如果用sample的话,就没有重复的字母,上面的choice 或choices是有重复字母的可能性的
25 print(l)
program
 1 1*1=1 
 2 1*2=2  2*2=4 
 3 1*3=3  2*3=6  3*3=9 
 4 1*4=4  2*4=8  3*4=12 4*4=16
 5 1*5=5  2*5=10 3*5=15 4*5=20 5*5=25
 6 1*6=6  2*6=12 3*6=18 4*6=24 5*6=30 6*6=36
 7 1*7=7  2*7=14 3*7=21 4*7=28 5*7=35 6*7=42 7*7=49
 8 1*8=8  2*8=16 3*8=24 4*8=32 5*8=40 6*8=48 7*8=56 8*8=64
 9 1*9=9  2*9=18 3*9=27 4*9=36 5*9=45 6*9=54 7*9=63 8*9=72 9*9=81
10 
11 
12 ['0001.lkbjmbfcwj', '0002.ciebvklpie', '0003.sjwtcakjjk', '0004.kuiivvfoai', '0005.ymaetkbdrt', '0006.ayhlrgedoh', '0007.xdjnaysdct', '0008.qkakrtdebv', '0009.jytyhtnwkc', '0010.rbxkiuetev', '0011.plhdxcdyvq', '0012.ubkudcrisb', '0013.yoceaqjvna', '0014.aeirhriutw', '0015.yemotxgfin', '0016.tehmlunsgy', '0017.seobircuxq', '0018.nxofutxipl', '0019.lbtmvkrhnj', '0020.rowntjaqpp', '0021.oadngppkty', '0022.ftdeifipph', '0023.fwuxgxgovt', '0024.bjnaxoqsxd', '0025.jhkjanttrr', '0026.eoutbjinyq', '0027.agdidptkcu', '0028.ccofruyutd', '0029.suchksvbva', '0030.ucvrshekrf', '0031.qikrlpilqi', '0032.ffdfqosxnh', '0033.jtotgqsdgm', '0034.jxssbjnclg', '0035.qandynxfat', '0036.ygodstktip', '0037.qklhxypdba', '0038.vlghicldkp', '0039.jbpyieqxkc', '0040.dcybelgsew', '0041.bumewnipnp', '0042.koqdtxfain', '0043.wpjdhnduah', '0044.vledqpcnpd', '0045.bkjisgagaj', '0046.ymdthjiphw', '0047.avqxthoilm', '0048.wsxtulxfnl', '0049.tmvdcqovcf', '0050.jcfnuaqfob', '0051.tpptnvysyv', '0052.bsmfywydnw', '0053.ivqotuhhgp', '0054.nfryeqntta', '0055.eyoxwwtuhl', '0056.hgtnxluwqy', '0057.buabekigsu', '0058.dxbflmyknn', '0059.bibmwmoitm', '0060.mmbyibfeeg', '0061.ulythfirrd', '0062.rnamiseafs', '0063.abpbtceqpd', '0064.fawoscqiub', '0065.aunqntadxh', '0066.owavtvxdrq', '0067.ahnioayayy', '0068.ojbuyqvmxf', '0069.svbqsppkes', '0070.ncqojtdtlg', '0071.hmbtvsuwah', '0072.iwqykfsisp', '0073.fymolgcbnh', '0074.txhnidqufy', '0075.icmhrnifjx', '0076.dvctqrjyhe', '0077.nqncmelbys', '0078.gbaqnpaxyy', '0079.gfirdjcrao', '0080.qcguhuqdwk', '0081.kuqellfomi', '0082.kpltlguvcc', '0083.lfeserogau', '0084.imgwnglrob', '0085.dvtcjupmmk', '0086.evswireebh', '0087.tlbordvirb', '0088.eleixowhur', '0089.mvpwqiottn', '0090.iokdlfvipt', '0091.tqeuiulywc', '0092.twrfdissos', '0093.ylbtevnroy', '0094.uvtifqqdny', '0095.kxrhorowny', '0096.qcygokxvys', '0097.gvlufbmctq', '0098.jmqgjidgxv', '0099.gxvbreoimr', '0100.ljjjoelvna']
answer

2、生成器表达式:

  定义:

    生成器就是迭代器,可以理解为一种数据类型,这种数据类型实现了迭代器协议,其他的数据类型需要调用自己内置的__iter_方法,所以生成器就是可迭代对象。

  生成器分类以及在Python中的表现形式:(Python有两种不同的方式提供生成器)

    ①生成器函数:常规函数定义,但是,使用yield 语句代替return语句,但是,yield在同一层函数中,可以多次使用,一次返回一个结果,返回一个结果后,将函数设置为挂起状态,以便下次从他离开的地方继续执行。

    ②生成器表达式:类似于列表的推导,但是生成器返回按需产生结果的一个对象,而不是一次性构建一个结果列表。

  语法:

    • (返回值 for 元素 in 可迭代对象 if 条件)
    • 列表解析式的中括号换成小括号
    • 返回一个生成器 

  和列表解析式的区别:

    • 生成器表达式是按需计算(或惰性求值,延迟计算)需要的时候才算值。
    • 列表解析式是立即返回值

  生成器:

    • 可迭代对象
    • 迭代器

  举例:    

 1 g = ('{:04}'.format(i) for i in range(1,11))
 2 print(g)
 3 
 4 a = next(g)
 5 
 6 for i in g:
 7     print('i',i)
 8 print('------------------')
 9 for j in g:
10     print('j',j)
11 
12 结果:
13 # 可以看出g 是一个生成器对象 generator
14 # next(g) 表示地址指针向下走一步
15 # 第一个for循环就将g 迭代完了
16 # 所以第二个for就没法往下进行迭代
17 # 因为生成器是无法向列表那样,一致迭代,当地址指针到了最后一个后,用next() 再迭代会报错
18 <generator object <genexpr> at 0x0000000001D9D318>
19 i 0002
20 i 0003
21 i 0004
22 i 0005
23 i 0006
24 i 0007
25 i 0008
26 i 0009
27 i 0010
28 ------------------
 1 对比:列表解析式:
 2 
 3 g = ['{:04}'.format(i) for i in range(1,11)]
 4 print(g)
 5 
 6 
 7 
 8 for i in g:
 9     print('i',i)
10 print('------------------')
11 for j in g:
12     print('j',j)
13 
14 
15 ['0001', '0002', '0003', '0004', '0005', '0006', '0007', '0008', '0009', '0010']
16 i 0001
17 i 0002
18 i 0003
19 i 0004
20 i 0005
21 i 0006
22 i 0007
23 i 0008
24 i 0009
25 i 0010
26 ------------------
27 j 0001
28 j 0002
29 j 0003
30 j 0004
31 j 0005
32 j 0006
33 j 0007
34 j 0008
35 j 0009
36 j 0010

      总结:

        生成器,延迟计算(惰性求值),返回迭代器,可以迭代,从前往后走一遍,不能回头。

        列表解析式:立即求值,返回的不是迭代器,是可迭代对象,从前往后走一遍后,可以回头

   注:

 1 it = (print('{}'.format(i + 1)) for i in range(2))
 2 
 3 first = next(it)
 4 
 5 second = next(it)
 6 
 7 val = first + second
 8 
 9 1
10 2
11 --------------------------------------------------------------------------
12 TypeError                                Traceback (most recent call last)
13 <ipython-input-10-8a69cb4a56e0> in <module>()
14       5 second = next(it)
15       6 
16 ----> 7 val = first + second
17 
18 TypeError: unsupported operand type(s) for +: 'NoneType' and 'NoneType'
19 
20 
21 # 事实上,it 生成器(generator)里边是None,print 是打印,
22 # 所以每次next(it) 的时候,要执行一次print(...),同时将None 赋值给变量
1 it = (x for x in range(10) if x %2)
2 first = next(it)
3 second = next(it)
4 val = first + second
5 print(val) # 4
例子

    生成器和列表解析式的对比:

      • 计算方式:
        • 生成器表达式延迟计算,列表解析式立即计算
      •  内存占用:
        • 单从返回值本身来说,生成器表达式省内存,列表解析式能返回新的列表
        • 生成器没有数据,内存占用极少,但是使用的时候,虽然一个个返回数据,但是合起来占用的内存也差不多
        • 列表解析式构造新的列表需要占用内存
      • 计算速度:
        • 单看计算时间看,生成器表达式好事非常短,列表解析式耗时长
        • 但是生成器本身并没有返回任何值,只返回一个生成器对象
        • 列表解析式构造并返回一个新的列表

    注:

      使用内建函数 iter() 可以将一个可迭代对象转换为一个生成器。iter([1,2,3])       

1 b = iter(range(4))
2 next(b) # 一直是0 ,因为每next一次,从新建一个生成器,所以一直在0的位置
3 
4 a = iter(range(4))
5 for i in a :
6     print(i) # 0,1,2,3,

      迭代器没有 len() 这个attribution 

3、集合解析式 Python3.x新增

    语法:

      • { 返回值 for 元素 in 可迭代对象 if 条件}
      • 列表解析式的中括号,换位大括号
      • 立即返回一个集合              

    用法:

      • { (x, x + 1) for i in range(10) }
      • { [x] for x in range(10)} # 这个会报错,[x ] ,集合中 不能有不可hash的 

4、字典解析:Python3 新增

    语法:

      • { 返回值 for 元素 in 可迭代对象 if 条件}
      • 使用 k-v 形式
      • 立即返回一个字典

    用法:       

 1 a = {x:(x, x + 1) for x in range(4)}
 2 print(a) # {0: (0, 1), 1: (1, 2), 2: (2, 3), 3: (3, 4)}
 3 b = {x:[x, x + 1] for x in range(4)}
 4 print(b) # {0: [0, 1], 1: [1, 2], 2: [2, 3], 3: [3, 4]}
 5 c = {(x,):[x, x + 1] for x in range(4)}
 6 print(c) # {(0,): [0, 1], (1,): [1, 2], (2,): [2, 3], (3,): [3, 4]}
 7 d = {[x]:[x, x + 1] for x in range(4)}
 8 print(d) # TypeError
 9 e = {chr(0x41 + x):x ** 2 for x in range(4)}
10 print(e) # {'A': 0, 'B': 1, 'C': 4, 'D': 9}
11 f = {str(x):y  for x in range(4) for y in range(3)}
12 print(f) # {'0': 2, '1': 2, '2': 2, '3': 2}  覆盖
13  
test

5、总结:

  ——生成器相对解析式而言,生成器主要节省了内存,事实上,效率上并没有明显的提高,所以一般只考虑内存问题就可以。

  ——Python2 映入列表解析式

  ——Python2.4 引入生成器表达式

  ——Python3 引入集合,字典解析式,并迁移到2.7

  ——一般来说,应该多用解析式,简短,高效,如果一个解析式非常复杂,要考虑拆解用for循环

  ——生成器和迭代器是不同的对象,但是都可迭代对象,迭代器可以用next()

    ——生成器是迭代器,迭代器不一定是生成器,  iter(range(4)) 不是生成器生成的

为什么要坚持,想一想当初!
原文地址:https://www.cnblogs.com/JerryZao/p/9490623.html