Pandas笔记:缺失值处理

import pandas as pd
import numpy as np
data = pd.read_csv("./data/test.csv")
print(data)
print(pd.isnull(data))          # 缺失值True,其他False
print(np.any(pd.isnull(data)))  # 有缺失值True,没有False
print(np.all(pd.notnull(data))) # 没有缺失True,有False
print(pd.isnull(data).any())    # 每列是否有缺失
print(pd.notnull(data).all())   # 每列没有缺失
print(data.dropna())    # 删除所有的缺失值
print(data.fillna("NULL"))  # 替换NULL
# 替换
data_new = data.replace("?",value=np.nan)
print(data_new.dropna())
 
  a  b    c    d
0  1  2  3.0  4.0
1  1  2  NaN  4.0
2  1  ?  3.0  4.0
3  1  2  3.0  4.0
4  1  2  3.0  NaN
       a      b      c      d
0  False  False  False  False
1  False  False   True  False
2  False  False  False  False
3  False  False  False  False
4  False  False  False   True
True
False
a    False
b    False
c     True
d     True
dtype: bool
a     True
b     True
c    False
d    False
dtype: bool
   a  b    c    d
0  1  2  3.0  4.0
2  1  ?  3.0  4.0
3  1  2  3.0  4.0
   a  b     c     d
0  1  2     3     4
1  1  2  NULL     4
2  1  ?     3     4
3  1  2     3     4
4  1  2     3  NULL
   a  b    c    d
0  1  2  3.0  4.0
3  1  2  3.0  4.0
 
原文地址:https://www.cnblogs.com/jumpkin1122/p/11509778.html