Python 列表解析list comprehension和生成表达式generator expression

如果想通过操作和处理一个序列(或其他的可迭代对象)来创建一个新的列表时可以使用列表解析(List comprehensions)和生成表达式(generator expression)

(1)list comprehension

[expr for iter_var in iterable ] or [expr for iter_ in iterable if cond_expr]

l1=[1,2,3,4,5]

[x+1 for x in l1]

[2, 3, 4, 5, 6]

[x-1 for x in l1 if x>3]

[3, 4]

dict([(x,x+1) for x in l1])

{1: 2, 2: 3, 3: 4, 4: 5, 5: 6}

vec1=[1,2,3]
vec2=[6,7,8]
sq=[vec1[i]+vec2[i] for i in range(len(vec1))]
print sq

[7, 9, 11]

[x*y for x in [1,2,3] for y in [3,4,5]]

[3, 4, 5, 6, 8, 10, 9, 12, 15]

[(x+y) for x in l1 for y in range(x)]

[1, 2, 3, 3, 4, 5, 4, 5, 6, 7, 5, 6, 7, 8, 9]
def t_f(x): return x+1 [t_f(i) for i in l1] [1, 2, 3, 4, 5] 等价于 map(t_f,l1)

(2)generator expression

通过列表生成式,我们可以直接创建一个列表。但是,受到内存限制,列表容量肯定是有限的。而且,创建一个包含100万个元素的列表,不仅占用很大的存储空间,如果我们仅仅需要访问前面几个元素,那后面绝大多数元素占用的空间都白白浪费了。所以应当考虑使用生成器表达式而不是列表解析.生成器表达式并不真正创建数字列表, 而是返回一个生成器generator,generator保存的是算法,每次调用next(g),就计算出g的下一个元素的值,直到计算到最后一个元素,没有更多的元素时,抛出StopIteration的错误。但是我们一般通过for循环来迭代它,并且不需要关心StopIteration的错误。


for n in g:
print(n)

由于这个生成器在每次计算出一个条目后,把这个条目“产生”(yield)出来。 生成器表达式使用了“惰性计算”(lazy evaluation,也有翻译为“延迟求值”,我以为这种按需调用call by need的方式翻译为惰性更好一些),只有在检索时才被赋值( evaluated),所以在列表比较长的情况下使用内存上更有效.A generator object in python is something like a lazy list. The elements are only evaluated as soon as you iterate over them. 

(expr for iter_var in iterable) or (expr for iter_var in interable if cond_expr)

ge1=(x+1 for x in l1 if x%2)
ge1

<generator object <genexpr> at 0x000000000959EA68>

type(ge1)

generator

for i in ge1:
    print i

[1, 2, 3, 4, 5]

some adds:

1)当需要只是执行一个循环的时候尽量使用循环而不是列表解析,这样更符合python提倡的直观性

2)当有内建的操作或者类型能够以更直接的方式实现的,不要使用列表解析

good:
l2=l1

bad:
l2=[x for x in l1]

3)如果需要对每个元素都调用并且返回结果时,应使用L1=map(f,L), 而不是 L1=[f(x) for x in L]

原文地址:https://www.cnblogs.com/dadadechengzi/p/6292156.html