机器学习上机作业1记录 && 相关知识点复习

import pandas as pd

df=pd.read_csv('woman.csv') 读取出来的是DataFrame格式

pd.shape 返回值是行数和列数(行数,列数),pd.shape[0] 返回的是行,pd.shape[1]返回的是列

"height","weight"

1,2

155,232

行数不算题头的名称

序号是从0开始的

可以直接print(df['weight']) 单引号双引号都可以

df.head()会直接输出前五行(0-4),如果需要指定具体是前几行,可以在head里面加上num

df.describle()会输出数量count,平均值mean,标准差std,最小值min,几个百分数分别代表在总体中排位百分多少的数是什么,最大值max

df.isnull()会出来一个bool矩阵看每一个是不是空,不是空的是False,是空的是True

df.isnull().sum() 统计各个列的空值个数

df.isnull().any()判断每个列是否有空值

时间才能证明一切,选好了就尽力去做吧!
原文地址:https://www.cnblogs.com/tingxilin/p/11595291.html