Python-pandas

Python-pandas
Python 中处理时间序列的主要工具是 pandas 库.

1.pannas 基础

1.1使用 DataFrame 类的第一步

#!/etc/bin/python
#coding=utf-8
import  numpy as py
import pandas as pd
df = pd.DataFrame([10, 20, 30, 40], columns=['numbers'],index=['a','b','c','d'])
print df

1.2使用 DataFram 类的第二步

a = np.random.standard_normal((9,4))
print  a.round(6)

df = pd.DataFrame(a)
print  df

df.columns=[['No1','No2','No3','No4']]

1.3 pandas如何取出表中一列数据所有的值并转换为array类型

# -*-coding: utf-8 -*-
import pandas as pd
#读取csv文件
df=pd.read_csv('A_2+20+DoW+VC.csv')
#求‘ave_time’的平均值
aveTime=df['ave_time'].mean()
#把ave_time这列的缺失值进进行填充,填充的方法是按这一列的平均值进行填充
df2=df.fillna(aveTime)
#取表中的第3列的所有值
col=df2.iloc[:,2]
#取表中的第3列的所有值
arrs=col.values
#输出结果
print(arrs)


1.4

原文地址:https://www.cnblogs.com/chaoren399/p/5796276.html