数据分析-numpy pandas

import numpy as np
# b = [[random.uniform(100,200) for _ in range(3)]]
# b = np.array(b)
#print b,b.T #转置,用于矩阵(列和行的互换)
"""
创建数组
array() 列表转换数组
arange() range的numpy arange(开始值,结束值,公差)
zeros ones 全是0的数组 全是1 zeros((2,4)) 2行,4列
empyy() #只申请内存不赋值
reshape() 改变原数组的形状,几行几列
"""
li = [random.randint(1,10) for _ in range(30)]
a = np.array(li)
print a[a>5] #遍历数组,返回bool数组,[Fasle,True...]
"""一元函数
abs fabs 计算整数和浮点数的绝对值
sqrt 个元素的平方根
square 平方
floor 小于等于个元素值的最大整数
rint 各元素四舍五入最接近的整数,保留dtype
modf 元素的小数部分和整数部分分开,类似divmod
=====二元函数
add 将数组对应的元素相加(保证两个数组的格式一致)
subtract 减去,同上
multiply 相乘
divide floor_divide 除法(向下取整)
maxinum fmax 最大值 fmax忽略NAN
mixinum fmix 最小值
mod 元素的求模计算(取余)
"""
sr = pd.Series(np.arange(10))
sr1 = sr[3:].copy()
# print sr1[1] #loc标签形式key==value 等价于sr1.loc[1]
print sr1.iloc[1] #下标,即suoyin形式
sr1.add(sr) #将两个series相加,缺失的series的值为0 //算术方法add sub div mul
第一种:
pd.DataFrame({'one':[1,2,3,4],'two':[4,3,2,1]})
# 产生的DataFrame会自动为Series分配所索引,并且列会按照排序的顺序排列

运行结果:
one two
0 1 4
1 2 3
2 3 2
3 4 1

> 指定列
可以通过columns参数指定顺序排列
data = pd.DataFrame({'one':[1,2,3,4],'two':[4,3,2,1]})
pd.DataFrame(data,columns=['one','two'])

# 打印结果会按照columns参数指定顺序


第二种:
pd.DataFrame({'one':pd.Series([1,2,3],index=['a','b','c']),'two':pd.Series([1,2,3],index=['b','a','c'])})
运行结果:
one two
a 1 2
b 2 1
c 3 3


原文地址:https://www.cnblogs.com/qlshao/p/12951477.html