Pandas
Series
# 创建Series实例
import pandas as pd
a = [1,2,3]
myvar = pd.Series(a)
print(myvar)
0 1
1 2
2 3
dtype: int64
# 指定index
b = ["Google", "Runoob", "Wiki"]
my_Series = pd.Series(b,index=["x","y","z"])
print(my_Series)
x Google
y Runoob
z Wiki
dtype: object
print(my_Series["y"])
Runoob
# 使用dict创建Series
sites = {1: "Google", 2: "Runoob", 3: "Wiki"}
myvar = pd.Series(sites)
print(myvar)
1 Google
2 Runoob
3 Wiki
dtype: object
# 使用dict创建并且指定index和name
sites = {1: "Google", 2: "Runoob", 3: "Wiki"}
myvar = pd.Series(sites, index = [1, 2], name="RUNOOB-Series-TEST" )
print(myvar)
1 Google
2 Runoob
Name: RUNOOB-Series-TEST, dtype: object
# 如果指定的index比原数据要少,则创建的Series数据以index为准
myvar = pd.Series(sites, index = [1, 2])
print(myvar)
1 Google
2 Runoob
dtype: object
DataFrame
构造方法:
pandas.DataFrame( data, index, columns, dtype, copy)
参数说明:
- data:一组数据(ndarray、series, map, lists, dict 等类型)。
- index:索引值,或者可以称为行标签。
- columns:列标签,默认为 RangeIndex (0, 1, 2, …, n) 。
- dtype:数据类型。
- copy:拷贝数据,默认为 False。
创建DataFrame实例
# 使用列表创建
import pandas as pd
data = [['Google',10],['Runoob',12],['Wiki',13]]
df = pd.DataFrame(data, columns=["Site","age"],dtype=float)
print(df)
# 使用ndarrays创建
data = {'Site':['Google', 'Runoob', 'Wiki'], 'Age':[10, 12, 13]}
df = pd.DataFrame(data)
print(df)
# 使用dict创建
data = [{'a': 1, 'b': 2},{'a': 5, 'b': 10, 'c': 20}]
df = pd.DataFrame(data)
print (df)
# 结果
a b c
0 1 2 NaN
1 5 10 20.0
DataFrame行
import pandas as pd
data = {
"calories": [420, 380, 390],
"duration": [50, 40, 45]
}
# 数据载入到 DataFrame 对象
df = pd.DataFrame(data)
# 返回第一行
print(df.loc[0])
print(df[0:1])
# 返回第二行
print(df.loc[1])
print(df[1:2])
# 行切片
print(df[:])
--更新中