DataFrame.groupby()简析

groupby分组函数

  返回值:返回重构格式的DataFrame,特别注意,groupby里面的字段内的数据重构后都会变成索引

  groupby(),一般和sun()一起使用,如下例:

from pandas import Series,DataFrame
a=[['Li','男','PE',98.],['Li','男','MATH',60.],['liu','男','MATH',60.],['yu','男','PE',100.]]

af=DataFrame(a,columns=['name','sex','course','score'])
af

产生的DataFrame结构为:

    

af.groupby(['name','course'])['score'].sum()#先将af按照namej进行分组,再按照score进行分组,最后将score进行叠加

生成的新DataFrame数据结构为:

    

特别注意:groupby里面的字段内的数据重构后都会变成索引

  当使用groupby()进行分组之前,name和course字段都为数值字段,不可进行访问,。执行group之前,执行下面代码:

af['Li']

  提示错误!

  使用group分组之后,name和course都变成了索引,name为外层索引,course为外层索引。执行下面代码:

af.groupby(['name','course'])['score'].sum()['Li']

  成功访问到了数据,显示结果:

   

原文地址:https://www.cnblogs.com/2017Crown/p/7247694.html