Pandas处理数据常用方法

# -*- coding: utf-8 -*-
import pandas as pd
"""
(1)利用pandas读取csv文件
"""
def readcsv(path):
df=pd.read_csv(path,sep=',')
print("1 打印索引:",df.index)
print("2 前五行",df[0:5])
print("3 只选择第五行",df.loc[5])
print("4 选择第5行和第七行",df.loc[[5,7]])
print("5 把身高作为该DataFrame的索引:",df.set_index('shengao',inplace=False,drop=True))
print("6 查看各行的数据格式:",df.dtypes)
print("7 查看列名:",df.columns)
print("8 查看数据值:",df.values)
list=df.values
print("9 数据的行数为:",len(list))
print("10 描述性统计:",df.describe)
print("11 转置为:",df.T)
#print("按列名排序",df.sort(columns='shengao'))
#使用DataFrame选择数据:
print("12 显示列名下的数据为:",df['shengao'])
#使用DataFrame筛选数据:
alist=[1.7]
r1=df['shengao'].isin(alist) #将要过滤的数据放入字典中,使用isin对数据进行筛选,返回行索引以及每行筛选的结果,若匹配则返回ture
print("13 结果为:",r1)
index1=df[df['shengao'].isin(alist)]#获取匹配结果为ture的行
print("14 索引值为:",index1)
print("15 统计:",df.sum().values)
print("16 统计:",df.cumsum().values)
print("17 最大值对应的索引:",df.idxmax())
df.insert(2,'s',2)
print("插入一列的结果",df.describe)
#在字典中获得数据http://scikit-learn.org/stable/modules/feature_extraction.html#feature-extraction

if __name__ == '__main__':
pathroad='E:/TestData/testdata/kehu.csv'
readcsv(pathroad)

原文地址:https://www.cnblogs.com/wangleBlogs/p/7280421.html