pandas读取数据03

读取excel表格:


============================

xlsx_income = pd.read_excel(r'E:Bigdata_writer数据挖掘第5章 Python数据处理工具--Pandasdata_test02.xlsx',sheetname=0,header=None,
                            skiprows=0,skip_footer=0,index_col=None,names=None,
                            parse_datas=False,na_values=None,thousands=None,convert_float=True)

#参数解析:
#1.第一个参数传入的是文件的路径
#2.sheetname指的是需要读取表格中的第几个Sheet,可以传表格中Sheet名称,也可以传Sheet索引值(从0开始的索引Sheet)
#3.header指的是是否需要将数据集的第一行作为表头、默认是需要的,如果不需要设置为None即可。
#name指的是 如果原数据集中没有字段(表头)、或者是想操作的时候赋予新的表头代替旧表头,可以通过该参数在读取数据时给数据框添加具体的表头
#skiprows指的是读取数据时指定跳过的开始行数(int型参数)
#skip_footer指的是读取数据时指定跳过的末尾行数(int参数)
#index_col指的是哪些列作为数据框的行索引(标签、读取之后的第一列),其参数形式是从0开始的索引(此索引代表列序号)
#na_values指的是原始数据中哪些特殊值(这个特殊值将会被NaN替换)代表了缺失值(NaN)
#thoousands千分位符
#convert_float默认是True,False的时候是将所有的数值型字段转换成浮点型字段
========================================

读取CSV文件

csv_income = pd.read_table('E:Bigdata_writer数据挖掘第5章 Python数据处理工具--Pandassunspots.csv',sep=',',index_col=None,)
print(csv_income.shape)  #查看数据集的行列数
#print(csv_income)
print(csv_income.dtypes)

读取txt文件:



原文地址:https://www.cnblogs.com/chenruhai/p/12464239.html