numpy 笔记

1 矩阵、数组、列表

#from numpy import *
import numpy as np

　　矩阵创建

>>> A = np.array([1,2,3])
array([1, 2, 3])
>>> A = np.mat(A)
matrix([[1, 2, 3]])
>>> np.shape(A)
(1, 3)
>>> B = np.matrix([1,2,3])
>>> np.shape(b)
(1, 3)

# 基本属性
>>>A = np.array([[2],[1]])
>>>A.ndim      #维度  dimension = 2
>>>m,n = A.shape        #m=2, n=1
>>>number = A.size      #元素总数 = 2
>>>A.dtype     　　　　#元素类型  dtype('int64')
>>>A.itemsize         #字节大小 = 8
>>>A.reshape(1,2)     　　#重构
>>>np.resize(A, (1,2))    #重构

　　常用数组，快速创建

>>>np.zeros((3,3))     #零矩阵，参数是一个tuple类型(3,3)
>>>np.ones((2,4))      #1矩阵，默认浮点型，可以使用dtype=int
>>>np.random.rand(2,2)     #随机阵
>>>np.random.randint(10,size=(3,3))   #0-10之间的随机整数矩阵 
>>>np.random.randint(2,8,size=(2,5))  #2-8之间的随机整数矩阵
>>>np.eye(2,2,dtype=int)   #单位阵, n=行，M=列，k=对角索引 
>>>np.diag([1,2,3])            #对角阵 
>>>np.identity(5)                #单位阵
>>>np.linspace(10,20,  5, endpoint =  False)        #等差数列   array([10., 12., 14., 16., 18.])
>>>np.logspace(1, 4, num=10,  base=2)            #等比数列   array([2.,  4.,  8., 16.])
>>>np.empty(A.shape)
>>>np.empty([3,2], dtype =  int)        #空数组
array([[         0, 1072168960],
       [         0, 1072168960],
       [         0,          0]])

　　数组操作

>>>A = np.arange(12, dtype = np.int8).reshape(3,4)
array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11]], dtype=int8)
>>>B = np.array([np.nan, 1, 2, np.nan, 3, 4, 5])
array([nan, 1., 2., nan, 3., 4., 5.])

# 索引
>>>A[[0,2],[3,1]]                 #array([3, 9])
>>>np.arange(10)[2:7:2]      #array([2, 4, 6])
>>>A[A>5]         #array([ 6,  7,  8,  9, 10, 11], dtype=int8)
>>>B[~np.isnan(B)]     #判断缺失，缺失也可用None表示，np.iscomplex() 判断复数
array([1., 2., 3., 4., 5.])

# 展开
>>>A.flatten()     #展开，返回副本
array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11], dtype=int8)
>>>A.ravel()       #展开，按需返回副本
array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11], dtype=int8)

# 广播 / 压缩
# 不同维度数据运算时，维度自动扩充，并按该维度第一个元素带入运算
>>>x = np.array([[1], [2], [3]])
>>>y = np.array([4, 5, 6]) 
>>>[u + v for (u,v) in np.broadcast(x,y)]
[5, 6, 7, 6, 7, 8, 7, 8, 9]
>>>x+y
array([[5, 6, 7],
       [6, 7, 8],
       [7, 8, 9]])
>>>np.squeeze(x)    #删除一维
>>>np.broadcast_to(y, (3,1))    #广播为指定格式
>>>np.expand_dims(y, axis=0)   #插入维度

# 迭代
# order：'C' — 按行，'F' — 按列，'A' — 原顺序，'k' — 元素在内存中的出现顺序
>>>a = np.arange(12).reshape(3,4)
>>>for i in a: print(i, end=' ')
[0 1 2 3] [4 5 6 7] [ 8  9 10 11]
>>>for i in np.nditer(a, order='C'): print(i, end=' ')     #多维迭代器，深度迭代 , 不指定时a.T与a迭代序列一致
0 1 2 3 4 5 6 7 8 9 10 11 

# 广播迭代
>>>a = np.arange(0,60,5).reshape(3,4)
>>>b = np.array([1,  2,  3,  4], dtype =  int)
>>>for x,y in np.nditer([a,b]): print("%d:%d" % (x,y), end=' ')
0:1 5:2 10:3 15:4 20:1 25:2 30:3 35:4 40:1 45:2 50:3 55:4

# 克隆
>>>b = a; c=a.copy()      #,order =  'C'|‘F’
>>>id(b) == id(a); id(c) == id(a)     #True, False

　　矩阵运算

>>>A = np.array([[1,2],[3,4]])      
>>>B = np.array([[11,12],[13,14]])
>>>A*B    #点积
array([[11, 24],
       [39, 56]])
>>>A*2    #点积
>>>np.multiply(A, B)    #点积，对应元素相乘，同A*B
>>>np.vdot(A, B)        #点积和，对应相乘相加 = 130

>>>np.mat(A)*np.mat(B)    #矩阵乘法
matrix([[37, 40],
        [85, 92]])
>>>np.matmul(A, B) #同np.mat(A)*np.mat(B), 维度不同时，广播
>>>np.dot(A, B)    #同np.mat(A)*np.mat(B)
>>>A.dot(B)　　     #同np.mat(A)*np.mat(B)

>>>np.inner(A, B)　　#内积， 最后一维
array([[35, 41],
       [81, 95]])

>>>A = mat(eye(2,2)*0.5)
>>>A.I    #逆矩阵
>>>A.T       #转置
>>>np.square(A）    #平方
>>>np.sqrt(A)       #开方

# 线性代数
>>>np.linalg.det(a)    #行列式
>>>np.linalg.solve(b, [0,2])   #线性方程组求解
>>>np.linalg.inv(x)　　 #逆矩阵

　　矩阵切片、分割、合并

>>>A = np.mat(np.random.randint(2,8,size=(3,4)))     #2-8之间的随机整数矩阵
matrix([[5, 4, 6, 3],
        [7, 3, 4, 2]
        [0, 5, 3, 1]]) 
>>>A[1:,1:]     #切片
matrix([[3, 4, 2]
        [5, 3, 1]]) 

>>>A=mat(np.ones((2,2)))
matrix([[ 1.,  1.],
        [ 1.,  1.]])
>>>B=np.mat(np.eye(2))
matrix([[ 1.,  0.],
        [ 0.,  1.]])

# 分割
>>>a = np.arange(9)
>>>np.split(a, 3)        #等分
[array([0, 1, 2]), array([3, 4, 5]), array([6, 7, 8])]
>>>np.split(a, [4,7])　　 #指定位置分割
[array([0, 1, 2, 3]), array([4, 5, 6]), array([7, 8])]
>>>a = np.arange(16).reshape(4,4)
>>>np.hsplit(a, 2)
>>>np.vsplit(a, 2)


# 拼接
>>>np.concatenate((a,b))    　　　　#默认axis=0  纵向拼接
>>>np.concatenate((a,b), axis=1)   #横向拼接
>>>np.stack((a,b),0)      #纵向拼接
>>>np.stack((a,b),1)      #横向拼接
>>>np.vstack((A, B))      #按列合并
matrix([[ 1.,  1.],
        [ 1.,  1.],
        [ 1.,  0.],
        [ 0.,  1.]])
>>>np.hstack((A, B))      #按行合并
matrix([[ 1.,  1.,  1.,  0.],
        [ 1.,  1.,  0.,  1.]])

# 追加
>>>a = np.array([[1,2,3],[4,5,6]])
>>>np.append(a, [7,8,9])   #转为一维数组
array([1, 2, 3, 4, 5, 6, 7, 8, 9])
>>>np.append(a, [[7,8,9]], axis=0)    #纵向拼接
array([[1,2,3],
　　　　[4,5,6],
　　　　[7,8,9])
>>>np.append(a, [[0,0,0],[7,8,9]], axis=1)    #横向拼接
array([[1, 2, 3, 0, 0, 0],
       [4, 5, 6, 7, 8, 9]])

# 插入
>>>np.insert(a,2,[11,12,13])      #序列对应位置插入
array([ 1,  2, 11, 12, 13,  3,  4,  5,  6])
>>>np.insert(a,1,[11],axis = 0)    #纵向插入，广播
array([[ 1,  2,  3],
       [11, 11, 11],
       [ 4,  5,  6]])
>>>np.insert(a,1,11,axis = 1)      #横向插入，广播
array([[ 1, 11,  2,  3],
       [ 4, 11,  5,  6]])

# 删除
>>>np.delete(a, 5)
>>>np.delete(a, 1, axis=0)
>>>np.delete(a, 1, axis=1)
>>>np.delete(a, np.s_[::2])

# 去重
>>>np.unique(a)
array([1, 2, 3, 4, 5, 6])
>>>np.unique(a, return_index = True)    #返回索引
(array([1, 2, 3, 4, 5, 6]), array([0, 1, 2, 3, 4, 5], dtype=int64))
>>>np.unique(a,return_inverse = True)　　#返回下标
>>>np.unique(a,return_counts = True)    #返回重复数

　　矩阵、数组、列表间类型转换

>>>A = [[1,2],[3,2],[5,2]]  #列表
[[1, 2], [3, 2], [5, 2]]
>>>B = np.array(A)       #列表 -> 数组
>>>B = np.asarray(A)    #列表 -> 数组
array([[1, 2],
       [3, 2],
       [5, 2]])
>>>C = np.mat(A)        #列表 -> 矩阵
matrix([[1, 2],
        [3, 2],
        [5, 2]])
>>>np.array(C)           #矩阵 -> 数组
array([[1, 2],
       [3, 2],
       [5, 2]])
>>>C.getA()           #矩阵 -> 数组
array([[1,2]
       [3,2]
       [5,2]])
>>>C.tolist()          #矩阵 -> 列表
[[1, 2], [3, 2], [5, 2]]
>>>B.tolist()          #数组 -> 列表
[[1, 2], [3, 2], [5, 2]]


# 注意： 一维矩阵与一维数组转列表结果不一致
>>>A = np.array([1,2,3])
array([1, 2, 3])
>>>B = np.mat([1,2,3])
matrix([[1, 2, 3]])
>>>C = A.tolist()   #数组 -> 列表
[1, 2, 3]
>>>D = B.tolist()   #矩阵 -> 列表
[[1, 2, 3]]
>>> (C==D)
False
>>> (C is D[0])    #矩阵表示成了二维形式
True

2 字符串操作

>>>np.char.add(['hello', 'hi'],['abc', 'xyz'])      #类似R的paste0
array(['helloabc'], dtype='<U8')
>>>np.char.multiply('Hello',3)              #类似R的rep
array('HelloHelloHello', dtype='<U15')
# 格式
>>>np.char.center('hello', 20, fillchar = '*')
array('*******hello********', dtype='<U20')
>>>np.char.capitalize('hello world')
array('Hello world', dtype='<U11')
>>>np.char.title('hello how are you?')
array('Hello How Are You?', dtype='<U18')
>>>np.char.lower(['HELLO','WORLD'])
array(['hello', 'world'], dtype='<U5')
>>>np.char.upper(['hello','world'])
array(['HELLO', 'WORLD'], dtype='<U5')
# 拆分
>>>np.char.split ('YiibaiPoint,Hyderabad,Telangana', sep = ',')
array(list(['YiibaiPoint', 'Hyderabad', 'Telangana']), dtype=object)
>>>np.char.splitlines('hello\rhow are you?')
array(list(['hello', 'how are you?']), dtype=object)
# 压缩
>>>np.char.strip(['arora','admin','java'],'a')
array(['ror', 'dmin', 'jav'], dtype='<U5')
>>>np.char.join([':','-'],['dmy','ymd'])
array(['d:m:y', 'y-m-d'], dtype='<U5')
# 替换
>>>np.char.replace ('He is a good boy', 'is', 'was')
array('He was a good boy', dtype='<U17')
# 编码、解码
>>>np.char.encode('hello', 'cp500') 
array(b'\x88\x85\x93\x93\x96', dtype='|S5')
>>>np.char.decode(b'\x88\x85\x93\x93\x96','cp500')
array('hello', dtype='<U5')

3 数学运算

>>>a = np.array([0,30,45,60,90])
>>>b = np.sin(a * np.pi/180)
>>>np.degrees(b)

# 四舍五入
>>>np.around(a, decimals =  -1)
>>>np.floor(a)
>>>np.ceil(a)

# 数组加减乘除
>>>np.add(a,b)
>>>np.subtract(a,b)
>>>np.multiply(a,b)
>>>np.divide(a,b)

# 其他操作
>>>np.reciprocal(a)      # 倒数
>>>np.power(a,b)        # a数组为底，b为幂
>>>np.mod(a,b)           # 数组a/b余数
>>>np.remainder(a,b)   # 余数

# 复数操作
>>>np.real(a)
>>>np.imag(a)
>>>np.conj(a)    # 共轭复数
>>>np.angle(a, deg =  True)

# 统计操作
>>>np.min(a, 0)　　  #列最小值
>>>np.max(a, 1)　　　#行最大值
>>>np.amin(a, 0)    #数组纵向最小，但参数表示全局
>>>np.amax(a, 1)    #数组横向最大
>>>np.mean(a, axis =  0)     #均值
>>>np.sum(a, axis=0)　　　　　 #列和
>>>np.average([1,2,3,4], weights=[4,3,2,1], returned=True)     #加权均值，返回权值和？
>>>np.std([1,2,3,4])     #标准差
>>>np.var([1,2,3,4])     #方差
>>>std = sqrt(mean((x - x.mean())**2))
>>>np.ptp(a, axis =  0)      # 极差
>>>np.percentile(a,50, axis =  1)     # 分位数
>>>np.median(a, axis =  0)     # 中位数

# 排序、排序索引
# kind = quicksort(默认), mergesort, heapsort
>>>a = np.array([[3,7],[9,1]])
>>>np.sort(a)　　# 按行
>>>np.sort(a, axis=0)   # 按列

>>>a = np.array([3,  1,  2])
>>>np.argsort(a)   # 按行排序索引
array([1, 2, 0], dtype=int64)
>>>a[np.argsort(a)]
>>>argmin(a, axis=0)   # 列最小值行索引
>>>argmax(a, axis=1)

>>>dt = np.dtype([('name', 'S10'),('age', int)])
>>>a = np.array([("raju",21),("anil",25),("ravi",17),("amar",27)], dtype = dt)
>>>np.sort(a, order = 'name')   # 按name
array([(b'amar', 27), (b'anil', 25), (b'raju', 21), (b'ravi', 17)], dtype=[('name', 'S10'), ('age', '<i4')])

>>>key = ('b','c','d','a')
>>>s = ('raju','anil','ravi','amar')
>>>np.lexsort((s,key))
array([3, 0, 1, 2], dtype=int64)

>>>np.nonzero(a)   #非零元素索引
>>>np.where(x > 3)   #满足指定条件的元素位置索引
>>>x = np.arange(9.).reshape(3, 3)
>>>condition = np.mod(x,2)==0
>>>np.extract(condition, x)　　#满足条件的元素，条件为逻辑值
array([0., 2., 4., 6., 8.])