DataFrame运算

算术运算

  • 加法—series对象.add(值)
  • 减法—series对象.sub(值/对象)

逻辑运算符号<、 >、|、 &

  1. 逻辑运算符号<、 >、|、 &—等价于sql中的where语句
    • 等价于numpy的逻辑运算
    • 返回的是布尔类型的对象(series/df)
  2. 逻辑运算函数
    • df.query()—相当于查询
    • series.isin(列表)---返回一个布尔series —sql里的 in关键词

统计运算

describe()
综合分析: 能够直接得出很多统计结果,count, mean, std, min, max 等

# 计算平均值、标准差、最大值、最小值
data.describe()

统计函数
min(最小值), max(最大值), mean(平均值), median(中位数), var(方差), std(标准差),mode(众数)结果

对于单个函数去进行统计的时候,坐标轴还是按照这些默认为“columns” (axis=0, default),如果要对行“index” 需要指定(axis=1)

  • df.max(axis=0/1) 0-列 1-行 min sum
  • df.idxmax(axis=0/1)- 最大值所在索引值

累计统计函数

  • 观察原数据不容易观察到的信息
  • series.cumsum--返回结果不是一个值

自定义运算
df.apply(func,axis)

  1. func—函数
  2. axis指定计算的轴

data[['open', 'close']].apply(lambda x: x.max() - x.min(), axis=0)

open     22.74
close    22.85
dtype: float64
原文地址:https://www.cnblogs.com/oklizz/p/11488660.html