在python中实现数据库下group by功能

在itertools包中，有groupby(iterable[,key])

在对data进行groupby前，先根据与groupby相同的key函数，对data进行排序sorted(data,key)。这是与数据库group by不同的地方。

根据key函数对原迭代器下的各个元素进行分组，将拥有相同函数结果的元素分到一个新的迭代器下，每个新的迭代器以key函数返回结果为标签。由于每次迭代结果会更新，所以最好将结果保存为列表。

例：

>>> from itertools import groupby
>>> def keyfunc(h):
　　if h>180:
　　　　return 'tall'
　　elif h<160:
　　　　return 'short'
　　else:
　　　　return 'middle'

>>> data=[190,180,182,160,155,170,167,178]
>>> data=sorted(data,key=keyfunc)
>>> for k,g in groupby(data,key=keyfunc):
　　print(k)
　　print(list(g))

结果：
middle
[180, 160, 170, 167, 178]
short
[155]
tall
[190, 182]

保存到列表的代码：

>>> groups=[]
>>> uniquekeys=[]
>>> for k,g in groupby(data,key=keyfunc):
　　groups=list(g)
　　uniquekeys=k
　　print(groups)
　　print(uniquekeys)

相关参考：http://blog.sina.com.cn/s/blog_67331d610102vkj6.html