Pandas 基础操作复习

Pandas

Series

# 创建Series实例
import pandas as pd
a = [1,2,3]
myvar = pd.Series(a)
print(myvar)
0    1
1    2
2    3
dtype: int64

# 指定index
b = ["Google", "Runoob", "Wiki"]
my_Series = pd.Series(b,index=["x","y","z"])

print(my_Series)
x    Google
y    Runoob
z      Wiki
dtype: object

print(my_Series["y"])
Runoob

# 使用dict创建Series
sites = {1: "Google", 2: "Runoob", 3: "Wiki"}
myvar = pd.Series(sites)
print(myvar)
1    Google
2    Runoob
3      Wiki
dtype: object

# 使用dict创建并且指定index和name
sites = {1: "Google", 2: "Runoob", 3: "Wiki"}
myvar = pd.Series(sites, index = [1, 2], name="RUNOOB-Series-TEST" )
print(myvar)
1    Google
2    Runoob
Name: RUNOOB-Series-TEST, dtype: object

# 如果指定的index比原数据要少,则创建的Series数据以index为准
myvar = pd.Series(sites, index = [1, 2])
print(myvar)
1    Google
2    Runoob
dtype: object

DataFrame

构造方法:

pandas.DataFrame( data, index, columns, dtype, copy)

参数说明:

data：一组数据(ndarray、series, map, lists, dict 等类型)。
index：索引值，或者可以称为行标签。
columns：列标签，默认为 RangeIndex (0, 1, 2, …, n) 。
dtype：数据类型。
copy：拷贝数据，默认为 False。

创建DataFrame实例

# 使用列表创建
import pandas as pd
data = [['Google',10],['Runoob',12],['Wiki',13]]
df = pd.DataFrame(data, columns=["Site","age"],dtype=float)
print(df)

# 使用ndarrays创建
data = {'Site':['Google', 'Runoob', 'Wiki'], 'Age':[10, 12, 13]}
df = pd.DataFrame(data)
print(df)

# 使用dict创建
data = [{'a': 1, 'b': 2},{'a': 5, 'b': 10, 'c': 20}]
df = pd.DataFrame(data)
print (df)
# 结果
   a   b     c
0  1   2   NaN
1  5  10  20.0

DataFrame行

import pandas as pd

data = {
  "calories": [420, 380, 390],
  "duration": [50, 40, 45]
}

# 数据载入到 DataFrame 对象
df = pd.DataFrame(data)

# 返回第一行
print(df.loc[0])
print(df[0:1])
# 返回第二行
print(df.loc[1])
print(df[1:2])

# 行切片
print(df[:])

--更新中