pandas之DataFrame

一、添加数据

1.创建数据框Object Creation

import pandas as pd
import numpy as np
dates=pd.date_range('2020-03-08',periods=7)
dF1=pd.DataFrame(np.random.rand(7,4),index=dates)

2.整合数据

Concat/Merge/Append
Concat:将数据框拼接在一起(可按rows或columns)
Merge:类似于SQL中Join的用法
Append:将数据按rows拼接到数据框中

3.数据导入和导出

Csv和Excel

二、数据查看及操作

1.查看

head():查看数据前几项,看数据长什么样
info():查看数据类型,以及数据缺失情况
descibe():查看数据描述统计性信息,数据大概分布情况

dF1.head()
dF1.info()
dF1.describe()

2.选取

#主要操作
dF1['属性名']
dF1[0:3]
dF1.loc[0]
dF1.iloc[1]
dF1.iloc[1:3,[0,3]]
dF1[dF1['属性名']>30]
dF1[dF1['A'].isin(['B'])]
dF1[dF1['A'].isin(['B'])&(dF1['C']>5)] 

3.分组

dF1.groupby('属性名')

4.删除行或列

#axis代表选中的是行还是列,列是1,行是2。inplace代表有没有真正删除
dF1.drop('A',axis = 1,inplace = True)

 

原文地址:https://www.cnblogs.com/huanghuangwei/p/12442653.html