缺失值处理

缺失值填补:

1、用0填补

df.fillna(0)

2、中位数填补

df.fillna(df.median(),inplace=True)

当变量较多时,用中位数代替是一种稳健的方法。

3、均值填补

df.fillna(df.mean(),inplace=True)

4、众数填补

df.fillna(df.mode().iloc[0],inplace=True)

5、用一个字符串代替缺失值

df.fillna('missing')
原文地址:https://www.cnblogs.com/Christina-Notebook/p/10102554.html