Pandas :Series、DataFrame 结构的数据创建

一、pandas核心数据结构:Series

理解:Series可以理解为一个一维的数组,只是index可以自己改动。类似于定长的有序字典,有Index和value。
创建的方法统一为:pd.Series(data,index=)         

1)打印的时候按照index赋值的顺序

2)index参数默认从0开始的整数,也是Series的绝对位置,即使index被赋值之后,绝对位置不会被覆盖,index赋值必须是list类型。

Series可以通过以下形式创建:python的dict、umpy当中的ndarray(numpy中的基本数据结构)、具体某个数值。

 代码:

import pandas as pd

# 创建一组Series数据
print(("---------------案例1--------------"))
# 书写格式1: 列表格式
s1 = pd.Series([90,86,70],index=["Leo","Kate","John"])
print(s1)

# 书写格式2:字典格式
dict={"leo":90,"kate":86,"john":70}

s2 = pd.Series(dict)
print("s2=","
",s2)


print(("--------------案例2--------------"))
s3=pd.Series([3,-5,7,4],index=list('ABCD'))
print("s3=","
",s3)

结果图:

 

二、pandas核心数据结构:DataFrame

理解:DataFrame是一个类似于表格的数据类型,DataFrame可以理解为一个二维数组,index有两个维度,可更改。


DataFrame参数:

data (方框内的数据)     :numpy ndarray、dict、 DataFrame
index(行索引索引)        :Index or array-like
columns (列索引)          :Index or array-like
dtype(data的数据类型) :dtype, 默认为 None

DataFrame统一的创建形式为pd.DataFrame(data,columns=,index=)

   其中columns为列的索引,index为行的索引。

   index或者columns如果不进行设置则默认为0开始的整数。

 代码:

import pandas as pd

print("---------案例1:--------------")
# 创建DataFrame,列名是:'name'、'gender'、'age'
df = pd.DataFrame([['Snow','M',22],
                   ['Tyrion','M',32],
                   ['Sansa','F',18],
                   ['Arya','F',14]], columns=['name','gender','age'])
print(df)

print("---------案例2:--------------")
# DataFrame创建,列名是:'Country'、'Capital'、'Population'
data=[['Belglum','Brussels',11190846],
      ['Indla','New Delhi',1303171035],
      ['Brazil','Brasilia',207847528]]

# index如果不写,默认从0开始序列,下面设置了从1开始序列
df1=pd.DataFrame(data=data,index=[1,2,3],columns=['Country','Capital','Population'])
print(df1)

结果图:

原文地址:https://www.cnblogs.com/wodexk/p/10314507.html