在python中实现数据库下group by功能

在itertools包中,有groupby(iterable[,key])

在对data进行groupby前,先根据与groupby相同的key函数,对data进行排序sorted(data,key)。这是与数据库group by不同的地方。

根据key函数对原迭代器下的各个元素进行分组,将拥有相同函数结果的元素分到一个新的迭代器下,每个新的迭代器以key函数返回结果为标签。由于每次迭代结果会更新,所以最好将结果保存为列表。

例:

>>> from itertools import groupby
>>> def keyfunc(h):
  if h>180:
    return 'tall'
  elif h<160:
    return 'short'
  else:
    return 'middle'


>>> data=[190,180,182,160,155,170,167,178]
>>> data=sorted(data,key=keyfunc)
>>> for k,g in groupby(data,key=keyfunc):
  print(k)
  print(list(g))

结果:
middle
[180, 160, 170, 167, 178]
short
[155]
tall
[190, 182]

保存到列表的代码:

>>> groups=[]
>>> uniquekeys=[]
>>> for k,g in groupby(data,key=keyfunc):
  groups=list(g)
  uniquekeys=k
  print(groups)
  print(uniquekeys)

相关参考:http://blog.sina.com.cn/s/blog_67331d610102vkj6.html

原文地址:https://www.cnblogs.com/yaofang/p/5420780.html