Pandas 数据读取

1.读取table

# 读取普通分隔数据:read_table
# 可以读取txt,csv

import os
os.chdir('F:/')   #首先设置一下读取的路径

data1 = pd.read_table('data1.txt', delimiter=',',header = 0)
print(data1)
data1 = pd.read_table('data1.txt', delimiter=',',header = 0, index_col=1) #index_col = 1把var2那列作为索引
print(data1)
# delimiter:用于拆分的字符,也可以用sep:sep = ','
# header:用做列名的序号,默认为0(第一行) header = 0 默认把第一行当作列来做参考
# index_col:指定某列为行索引,否则自动索引0, 1, .....  不指定就没有

# read_table主要用于读取简单的数据,txt/csv

输出结果:

   va1  va2  va3  va4
0    1    2    3    4
1    2    3    4    5
2    3    4    5    6
3    4    5    6    7
     va1  va3  va4
va2               
2      1    3    4
3      2    4    5
4      3    5    6
5      4    6    7

2.读取csv数据

# 读取csv数据:read_csv
# 先熟悉一下excel怎么导出csv

data2 = pd.read_csv('data2.csv',encoding = 'utf-8')
print(data2.head())
# encoding:指定字符集类型,即编码,通常指定为'utf-8'

# 大多数情况先将excel导出csv(excel另存为csv格式),再读取

3.读取excel数据

# 读取excel数据:read_excel

data3 = pd.read_excel('数据库.xlsx',sheet_name='数据库',header=0)
print(data3.head())
# io :文件路径。
# sheetname:返回多表使用sheetname=[0,1],若sheetname=None是返回全表 → ① int/string 返回的是dataframe ②而none和list返回的是dict
#sheetname可以写表本身的名称,也可以写0,1,2指的是读取这个excel里面哪一页的表
# header:指定列名行,默认0,即取第一行
# index_col:指定列为索引列,也可以使用u”strings”
原文地址:https://www.cnblogs.com/carlber/p/9926133.html