pandas库的数据类型运算

pandas库的数据类型运算

算数运算法则

  • 根据行列索引,补齐运算(不同索引不运算,行列索引相同才运算),默认产生浮点数
  • 补齐时默认填充NaN空值
  • 二维和一维,一维和0维之间采用广播运算(低维元素与每一个高维元素运算)
  • 采用 +-*/符号的二元运算会产生新的对象
a = pd.DataFrame(np.arange(12).reshape(3,4))
a

b = pd.DataFrame(np.arange(20).reshape(4,5))
b

# 维度相同,行列内元素个数不同的运算,自动补齐,缺项NaN
a + b
a * b

除了使用+-*/,也可使用方法形式,好处是可以增加可选参数

  • .add(d,**argws) 类型间加法运算,可选参数
  • .sub(d,**argws) 类型间减法运算,可选参数
  • .mul(d,**argws) 类型间乘法运算,可选参数
  • .div(d,**argws) 类型间除法运算,可选参数
b.add(a,fill_value = 100) #将a和b之间的缺失元素用100补齐并参加与运算
a.mul(b,fill_value = 0)

不同维度运算

b = pd.DataFrame(np.arange(20).reshape(4,5))
b
c = pd.Series(np.arange(4))
c

c - 10
b - c #b的每一行都与c运算一遍,二维和一维运算默认在轴1(行)发生
b.sub(c,axis=0) #指定用 列 参与运算

比较运算法则

  • 比较运算只能比较相同索引的元素,不进行补齐(尺寸不同会报错)
  • 二维和一维/一维和零维间为广播运算
  • 采用>< >= <= -- !=等符号进行的二元运算产生布尔对象
a = pd.DataFrame(np.arange(12).reshape(3,4))
a
d = pd.DataFrame(np.arange(12,0,-1).reshape(3,4))
d

a > d #bool值表
a == d
b = pd.DataFrame(np.arange(12).reshape(3,4))
b
c = pd.Series(np.arange(4))
c

a > c
c > 0
原文地址:https://www.cnblogs.com/yoyo1216/p/10131791.html