python中的pandas的两种基本使用

python中的pandas的两种基本使用
2018年05月19日 16:03:36 木子柒努力成长 阅读数:480

一、pandas简介
pandas:panel data analysis(面板数据分析),是基于numpy 构建的含有更高级数据结构和工具的数据分析包,类似于numpy ,pandas也是围绕着Series 和 DataFrame两个核心数据结构展开的。Series 和 DataFrame 分别对应于一维的数列和二维的表结构。pandas的导入方式如下:

import pandas as pd

from pandas import Series,DataFrame
1.创建对象
1.1,可以通过传递一个list对象来创建一个Series,pandas默认创建整型索引:

import numpy as np

import pandas as pd

from pandas import Series,DataFrame

s=Series([1,2,3,4,np.nan,6])

print(s)

0 1.0

1 2.0

2 3.0

3 4.0

4 NaN

5 6.0

dtype: float64
1.2,通过传递一个能够被转换成类似序列结构的的字典对象来创建一个DataFrame:

from pandas import Series,DataFrame

data={'state':['yes','yes','yes','no','no'],

'year':[2000,2001,2002,2003,2004],

'pop':[1.5,1.7,3.6,2.4,2.9]}

s=DataFrame(data)

print(s)

pop state year

0 1.5 yes 2000

1 1.7 yes 2001

2 3.6 yes 2002

3 2.4 no 2003

4 2.9 no 2004
1.3,查看数据类型和查看数据

print(s.dtypes)

print(s.head(1))

print(s.tail(2))

pop float64

state object

year int64

dtype: object

pop state year

0 1.5 yes 2000

pop state year

3 2.4 no 2003

4 2.9 no 2004

原文地址:https://www.cnblogs.com/duanlinxiao/p/9820768.html