pandas 数据预处理

pandas 数据预处理

缺失数据处理
csv_data='''
A,B,C,D
1.0,2.0,3.0,4.0
5.6,6.0,,8.0
0.0,11.0,12.0,,'''
import pandas as pd
from io import StringIO
df = pd.read_csv(StringIO(csv_data))
print(df)
   A   B     C    D
0  1   2   3.0  4.0
1  5   6   NaN  8.0
2  0  11  12.0  NaN
  • 在上述代码中,pandas中的模块利用read_csv函数将数据转化为数据框,可以看到其中的缺失值由NaN代替,即表示Not a Number,可以使用pandas中的isnull函数查看每列中缺失值的数量
print(df.isnull().sum())

A    0
B    0
C    1
D    1
dtype: int64
原文地址:https://www.cnblogs.com/onemorepoint/p/9224067.html