2018.03.29 python-pandas 数据读取

#数据读取
# read_table,read_csv,read_excel

 1 #读取普通分隔数据：read_table
 2 #可以读取txt，csv
 3 import os
 4 import pandas as pd
 5 os.chdir(r'C:UsersBRIGHT-SH-002Desktoppython')
 6 
 7 
 8 data1 = pd.read_table('data1.csv',delimiter=',',header=0)
 9 print(data1)
10 data1 = pd.read_table('data1.csv',delimiter=',',header=0,index_col=0)
11 print(data1)
12 #delimiter:用于拆分的字符，也可以用sep：sep=','
13 #header：用做列名的序号，默认为0（第一行）
14 #index_col:指定将某烈为行索引，否则自动索引0,1 （作为索引列）
15 
16 #read_table主要用于读取简单的数据 txt/csv

结果：

   va1 va2 va3 va4
0    1    2    3    4
1    2    3    4    5
2    3    4    5    6
3    4    5    6    7
     va2 va3 va4
va1
1      2    3    4
2      3    4    5
3      4    5    6
4      5    6    7

1 # 读取csv数据：read_csv
2 # 先熟悉一下excel怎么导出csv
3 data2 = pd.read_csv('data2.csv',engine='python')
4 print(data2.head())
5 #engine:使用的分析引擎，可以选择C或者python。 C引擎快但是python引擎更加完备
6 #encoding：指定字符集类型，即编码，通常指定'utf-8'
7 print(type(data2))
8 #大多数情况先将excel导出csv，再读取

#读取excel数据:read_excel
data3 = pd.read_excel('test.xlsx',sheet_name='test1',header=0)
print(data3.head())
#io:文件路径
#sheet_name:返回多个表用sheet_name=[0,1],若sheet_name=None是返回全表 
                                    #-> 1.int/string 返回的是dataframe 2.而None和list返回的是dict
#header:指定列名行，默认0，取第一行
#index_col:指定列为索引列，也可以使用：'strings'