Pandas系列教程(1)Pandas数据读取

1. 下载安装pandas

pip install pandas
pip install pandas -i https://pypi.tuna.tsinghua.edu.cn/simple

2. Pandas数据读取

Pandas需要先读取表格类型的数据,然后进行分析

数据类型说明Pandas读取方法
csv, tsv, txt 用逗号分隔,tab分隔的纯文本文件 pd.read_csv
excel 微软xls或者xlsx文件 pd.read_excel
mysql 关系型数据库表 pd.read_sql

2.1 Pandas读取纯文本文件

读取csv文件

# 读取csv文件,使用默认的标题行,逗号分隔符
import pandas as pd

file_path = '../files/ratings.csv'

# 使用pd.read_csv读取数据
ratings = pd.read_csv(file_path)
print(ratings)

# 查看数据的前几行
print("查看数据的前几行:
 ", ratings.head())

# 查看数据的形状(返回行数,列数)
print("查看数据的形状:
 ", ratings.shape)

# 查看列表列名
print("查看列表列名:
 ", ratings.columns)

# 查看索引列
print("查看索引列:
 ", ratings.index)

# 查看每列的数据类型
print("查看每列的数据类型:
 ", ratings.dtypes)

读取txt文件

# 读取csv文件,使用默认的标题行,逗号分隔符

import pandas as pd

file_path = '../files/access_pvuv.txt'

# 使用pd.read_csv读取数据
pvuv = pd.read_csv(file_path, sep='	', header=None, names=['pdate', 'pv', 'uv'])
"""
sep: 指定列的分隔符
header: 没有标题行设置为None
names: 自定义列名
"""
print(pvuv)

# 查看数据的前几行
print("查看数据的前几行:
 ", pvuv.head())

# 查看数据的形状(返回行数,列数)
print("查看数据的形状:
 ", pvuv.shape)

# 查看列表列名
print("查看列表列名:
 ", pvuv.columns)

# 查看索引列
print("查看索引列:
 ", pvuv.index)

# 查看每列的数据类型
print("查看每列的数据类型:
 ", pvuv.dtypes)

2.2 读取excel文件

# 读取csv文件,使用默认的标题行,逗号分隔符

import pandas as pd

file_path = '../files/access_pvuv.xlsx'

# 使用pd.read_excel读取数据
pvuv = pd.read_excel(file_path)
print(pvuv)

2.3 读取mysql

# 读取csv文件,使用默认的标题行,逗号分隔符
import pymysql
import pandas as pd

# 创建数据库连接
conn = pymysql.connect(host='127.0.0.1', user='root', password='123456', database='demo', charset='utf8')

# 使用pd.read_excel读取数据
pvuv = pd.read_sql("select * from crazyant_pvuv", con=conn)
print(pvuv)
原文地址:https://www.cnblogs.com/xingxingnbsp/p/13851588.html