pandas模块

pandas模块

基于numpy,用于文本处理或者表格数据处理.

# import pandas as pd规定

主要功能

  1. 持文件存取操作,支持数据库(sql)、html、json、pickle、csv(txt、excel)、sas、stata、hdf等。
  2. 支持增删改查、切片、高阶函数、分组聚合等单表操作,以及和dict、list的互相转换。
  3. 支持多表拼接合并操作。
  4. 支持简单的绘图操作。
  5. 支持简单的统计分析操作。

两个主要数据解构

Series类似numpy中一维数组

DataFrame类似多维表格数据结构

产生数组对象date_range

DataFrame属性
属性 详解
dtype是 查看数据类型
index 查看行序列或者索引
columns 查看各列的标签
values 查看数据框内的数据,也即不含表头索引的数据
describe 查看数据每一列的极值,均值,中位数,只可用于数值型数据
transpose 转置,也可用T来操作
sort_index 排序,可按行或列index排序输出
sort_values 按数据值来排序

主要参数index,columns,val

原文地址:https://www.cnblogs.com/agsol/p/11608757.html