numpy+pandas 基础学习

#-*- coding:utf-8 -*-
import numpy as np;

data1=[1,2,3,4,5]
array1=np.array(data1)

#创建数组/矩阵
# 使用numpy中的array函数
data2=[[1,3,4],[2,5,6]]
array2=np.array(data2)

#查看变量的数据类型:dtype
array2.dtype

#转换数据格式 astype
array2_str=array2.astype('str')
array2_str.dtype

## pandas 有两个数据结构:Series和 DataFrame
## Series类似一维数组,和array很像,由一组数据和数据标签(类似索引)组成
## Series 能自动对齐索引,如果对不上,会NaN表示缺失
import pandas as pd;
s=pd.Series([1,2,3,4]);
s1=pd.Series([1,2,3,4],index=['a','b','c','d'])
s.index
s[1]
s[[1,2]]

#字典
d={'qiulu':'handsome',
   'lulu':'graceful'
   }
s2=pd.Series(d)

## DataFrame是一个表格型的数据结构,类似一张excel表格或者SQL
##最常用的构建DataFrame的方法是:传入一个字典
dict={
    'name':['张三','李四','王五','赵六'],
    'sex':['男','男','男','女'],
    'age':[18,19,20,21]
}

df=pd.DataFrame(dict)

df.info()  ## 查看数据类型
df.age.astype('str')
df['age']

df['age']=[19,20,21,22]
df['country']='china'

# DataFrame查询会特别方便
df[df.age==20]
df[(df.age>=20) & (df.sex=='男')]

# query 可以类似SQL的查询方式
df.query('(age>18 and sex=="男") or (age<21 and sex=="女")')

df1=pd.DataFrame(np.arange(4).reshape(2,2),columns=['a','b'])
df2=pd.DataFrame(np.arange(12).reshape(2,6),columns=['a','b','c','d','e','f'])

## iloc  序号
## loc   标签
## ix   行+列,序号标签都行
原文地址:https://www.cnblogs.com/skyEva/p/7372858.html