Pandas 数据读取

1.读取table

# 读取普通分隔数据：read_table
# 可以读取txt，csv

import os
os.chdir('F:/')   #首先设置一下读取的路径

data1 = pd.read_table('data1.txt', delimiter=',',header = 0)
print(data1)
data1 = pd.read_table('data1.txt', delimiter=',',header = 0, index_col=1) #index_col = 1把var2那列作为索引
print(data1)
# delimiter：用于拆分的字符，也可以用sep：sep = ','
# header：用做列名的序号，默认为0（第一行） header = 0 默认把第一行当作列来做参考
# index_col：指定某列为行索引，否则自动索引0, 1, .....  不指定就没有

# read_table主要用于读取简单的数据，txt/csv

输出结果：

   va1  va2  va3  va4
0    1    2    3    4
1    2    3    4    5
2    3    4    5    6
3    4    5    6    7
     va1  va3  va4
va2               
2      1    3    4
3      2    4    5
4      3    5    6
5      4    6    7

2.读取csv数据

# 读取csv数据：read_csv
# 先熟悉一下excel怎么导出csv

data2 = pd.read_csv('data2.csv',encoding = 'utf-8')
print(data2.head())
# encoding：指定字符集类型，即编码，通常指定为'utf-8'

# 大多数情况先将excel导出csv（excel另存为csv格式），再读取

3.读取excel数据

# 读取excel数据：read_excel

data3 = pd.read_excel('数据库.xlsx',sheet_name='数据库',header=0)
print(data3.head())
# io ：文件路径。
# sheetname：返回多表使用sheetname=[0,1],若sheetname=None是返回全表 → ① int/string 返回的是dataframe ②而none和list返回的是dict
#sheetname可以写表本身的名称，也可以写0，1，2指的是读取这个excel里面哪一页的表
# header：指定列名行，默认0，即取第一行
# index_col：指定列为索引列，也可以使用u”strings”