Python笔记 #12# Dictionary & Pandas: Object Creation

Document of Dictionaries 

10 Minutes to pandas

tutorialspoint

import pandas as pd
data = [['Alex',10],['Bob',12],['Clarke',13]]
df = pd.DataFrame(data,columns=['Name','Age'],dtype=float)
print df
      Name     Age
0     Alex     10.0
1     Bob      12.0
2     Clarke   13.0

Series 和 DataFrame 的创建

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

s = pd.Series([1, 2, 5, np.nan, 6, 8]) # 类似于 numpy 的 array 不过是一维的,仅限一维哦

# print(s)
# 0    1.0
# 1    2.0
# 2    5.0
# 3    NaN # not a number 表示无穷或者非数值
# 4    6.0
# 5    8.0
# dtype: float64


dates = pd.date_range('20180116', periods=3) # 创建 16 17 18 等 3 个日期,待会儿作为行

df = pd.DataFrame(np.random.randn(3,4), index=dates, columns=list('ABCD')) # 这是二维的,类似于一个表!
# 通过 numpy 随机了一个 3 * 4 的数据,这和行数、列数是相对应的
# print(df)
#                    A         B         C         D
# 2018-01-16 -0.139759  0.857653  0.754470  0.224313
# 2018-01-17  1.565070  0.521973 -1.265168 -0.278524
# 2018-01-18 -0.668574 -0.527155  0.877785 -1.123334

# 直接通过一个字典也是可以创建 dataFrame 的。
df2 = pd.DataFrame({'A' : 1.,
                    'B' : pd.Timestamp('20130102'),
                    'C' : pd.Series(1,index=list(range(4)),dtype='float32'),
                    'D' : np.array([3] * 4,dtype='int32'),
                    'E' : pd.Categorical(["test","train","test","train"]),
                    'F' : 'foo' })
# print(df2)
#      A          B    C  D      E    F
# 0  1.0 2013-01-02  1.0  3   test  foo
# 1  1.0 2013-01-02  1.0  3  train  foo
# 2  1.0 2013-01-02  1.0  3   test  foo
# 3  1.0 2013-01-02  1.0  3  train  foo

# 取得具体的类型
# print(df2.dtypes)
# A           float64
# B    datetime64[ns]
# C           float32
# D             int32
# E          category
# F            object
# dtype: object
原文地址:https://www.cnblogs.com/xkxf/p/8297109.html