numpy基础一

常用，常忘

1.随机矩阵

np.random.rand(4,3)
array([[ 0.06679473,  0.71073515,  0.5694172 ],
       [ 0.95018143,  0.60161401,  0.8076899 ],
       [ 0.40341822,  0.72154255,  0.92283012],
       [ 0.81143322,  0.87853742,  0.38013707]])

np.random.randint(0,10,(4,3))
array([[1, 9, 5],
       [6, 1, 1],
       [8, 2, 0],
       [3, 4, 3]])

numpy概览

import numpy as np

array=np.array([1,2,3,4])
array.shape
(4,)

array2=np.array([[1,2,3,4],[2,3,4,1]])
array2.shape
(2, 4)

array3=np.array([[1,2,3,4],[2,3,4,1]])
type(array3)
numpy.ndarray

np.array的结构

1. dtype  数据类型
2. itemsize 占了多少字节
3. shape  形状
4. size  数据个数
5. ndim  维度
6. fill填充
7. 索引和切片


* 要求array里面的数据是同一种类型，如果不是，numpy会转为一种
* int<float<String（取值类型顺序）

import numpy as np
array1=np.array([1,2,3,4])
array1.dtype
# >>>  dtype('int32')


array2=np.array([1,2,3,4.5])
array2.dtype
#>>>  dtype('float64')

array3=np.array([1,'2',3,4.5])
array3.dtype
#>>>dtype('<U11') 


weidu=np.array([[1,2,3],[1,3,2],[4,2,1]])
print(weidu.dtype)
print(weidu.itemsize)
print(weidu.shape)
print(weidu.size)
print(weidu.ndim)

#>>> nt32
#>>> 4
#>>> (3, 3)
#>>> 9
#>>> 2


weidu2=np.array([[1,2,3],[1,3,2],[4,2,1]])
weidu2.fill(0)
print(weidu2)

# >>>
[[0 0 0]
 [0 0 0]
 [0 0 0]]

矩阵格式（多维的形式）

多维度的取值方式和list不同
nb.array.copy 深度复制
arange(0,100,10) 0到100 , 差值10构造等差数组
布尔数组作为索引取值
随机值random.rand(10) 0到1制作10个随机数生成np数组

weidu3=np.array([[1,2,3],[1,3,2],[4,2,1]])
print(weidu3[1,1])
print(weidu[:,1]) #每一行的第二个数
print(weidu[:,0:2]) #每一行的第一和第二个数
weidu[:,0:2][0,1]

#>>>
3
[2 3 2]
[[1 2]
 [1 3]
 [4 2]]
2



one=np.array([[1,2],[3,4]])
oneCopy=one.copy()
oneCopy[0,1]=100
print(one)
print(oneCopy)



#>>>
[[1 2]
 [3 4]]
[[  1 100]
 [  3   4]]



pan_array=np.array([1,2,3,4,5,6],dtype=np.float32)
print(pan_array)
print(pan_array.dtype)
print(pan_array.nbytes) # 32位 四个字节 * 6 =24B

#>>>
[1. 2. 3. 4. 5. 6.]
float32
24

布尔数组作为索引取值


indexs=np.array([0,1,0,2,0,1,0],dtype=bool)
print(indexs)
numbers=np.array([10,20,30,4,5,7,8])
result=numbers[indexs]  #在索引为true的地方取值
print(result)

#>>>>
[False  True False  True False  True False]
[20  4  7]

随机数转化为布尔值

random_array=np.random.rand(10)
print(random_array)
boolarray=random_array>0.5
print(boolarray)

#>>>
[0.18501146 0.03588    0.04643065 0.88957392 0.15500452 0.49480942
 0.28144087 0.83287192 0.72878256 0.66462199]
[False False False  True False False False  True  True  True]

按条件找到索引

array_index=np.array([1,2,3,4,5,6,8,2,1,3,11,6,8,12])
result=np.where(array_index > 8)
print(result)
print(array_index[np.where(array_index > 8)])

#>>>
(array([10, 13], dtype=int64),)
[11 12]

np.asarray 重新给np.array指定数值类型---深度copy

pan_int32=np.array([1,2,3],dtype=np.int32)
pan_float32=np.asarray(pan_int32,dtype=np.float32)
print(pan_float32)
print(pan_int32)

np.array的数值计算

sum 求和
prod 求积
min 最小值
max 最大值
argmin最小值的索引
argmax最大值的索引
mean求平均值
std 标准差
var 方差
clip 限定边界值
round
轴用来为超过一维的数组定义的属性，二维数据拥有两个轴：第0轴沿着行的垂直往下，第1轴沿着列的方向水平延伸。

import numpy as np

pan_array=np.array([[1,2,3],[1,2,3]])
print(pan_array)
print(pan_array.ndim)

sum

np.sum(pan_array)
#>>> 12

指定操作沿着什么轴进行

np.sum(pan_array,axis=0)
#>>> array([2, 4, 6])

np.sum(pan_array,axis=1)
#>>> array([6, 6])

-1指定最后一个维度

np.sum(pan_array,axis=-1)
#>>>
array([6, 6])

prod 求积

array_prod=np.array([[1,2,3,4],[2,2,3,5]])
array_prod.prod()
#>>> 
1440

array_prod.prod(axis=0)
#>>>
array([ 2,  4,  9, 20])

array_prod.prod(axis=1)
#>>>
array([24, 60])

array_prod.prod(axis=-1)
#>>>
array([24, 60])

min最小值

array_min=np.array([[1,22,3,5],[1,12,6,7]])
array_min.min()
#>>>
1

array_min.min(axis=0)
#>>>
array([ 1, 12,  3,  5])

array([ 1, 12,  3,  5])
#>>>
array([1, 1])

max最大值

array_max=np.array([[1,2,3,4,5],[5,4,3,2,1]])
array_max.max()
#>>>
5

array_max.max(axis=0)
#>>>
array([5, 4, 3, 4, 5])

array_max.max(axis=1)
#>>>
array([5, 5])

argmin最小值索引

argmin=np.array([[1,2,3],[2,1,4]])
argmin.argmin()
#>>>
0

argmin.argmin(axis=0)
#>>>
array([0, 1, 0], dtype=int64)

argmin.argmin(axis=1)
#>>>
array([0, 1], dtype=int64)

argmax

argmax=np.array([[12,5,77,1],[2,3,4,6]])

argmax.argmax()
#>>>
2

argmax.argmax(axis=0)
#>>>
array([0, 0, 0, 1], dtype=int64)

argmax.argmax(axis=1)
#>>>
array([2, 3], dtype=int64)

mean 平均值

array_mean=np.array([[1,2,3,4],[2,3,4,5]])

array_mean.mean()
#>>>
3.0

array_mean.mean(axis=0)
#>>>
array([1.5, 2.5, 3.5, 4.5])

array_mean.mean(axis=1)
#>>>
array([2.5, 3.5])

std 标准差

array_std=np.array([[1,2,3,4],[2,3,4,5]])

array_std.std()
#>>>
1.224744871391589

array_std.std(axis=0)
#>>>
array([0.5, 0.5, 0.5, 0.5])

array_std.std(axis=-1)
#>>>
array([1.11803399, 1.11803399])

var 方差

array_var=np.array([[1,2,3],[2,3,4]])

array_var.var()
#>>>
0.9166666666666666

array_var.var(axis=0)
#>>>
array([0.25, 0.25, 0.25])

array_var.var(axis=1)
#>>>
array([0.66666667, 0.66666667])

clip 边界限定 (超过边界，就按边界取值)


array_clip=np.array([[1,2,3,4],[2,3,4,5]])
array_clip=np.array([[1,2,3,4],[2,3,4,5]])

array_clip.clip(2,4)
#>>>
array([[2, 2, 3, 4],
       [2, 3, 4, 4]])

round四舍五入

array_round=np.array([[1.111,2.222,3.333,4.444],[2.111,3.222,4.333,5.444]])

array_round.round(decimals=1)
#>>>>
array([[1.1, 2.2, 3.3, 4.4],
       [2.1, 3.2, 4.3, 5.4]])

array_round.round(decimals=2)
#>>>
array([[1.11, 2.22, 3.33, 4.44],
       [2.11, 3.22, 4.33, 5.44]])

numpy 排序

sort 升序排序
argsort 排序后的位置
linspace 等差出列造数据
searchsorted 插入序列,返回位置
lexsort 多维度排序

import numpy as np

sort

array_sort=np.array([5,1,2,3,4,5])
array_sort.sort()
print(array_soprt)
#>>>
[1 2 3 4 5 5]

argsort

array_argsort=np.array([1,5,2,1,3,24,2,6,5])
array_argsort.argsort()
#>>>
array([0, 3, 2, 6, 4, 1, 8, 7, 5], dtype=int64)

lispace

array_linspace=np.linspace(1,10,10)
print(array_linspace)

#>>>
[ 1.  2.  3.  4.  5.  6.  7.  8.  9. 10.]

searchsorted 查看值的位置

array_linspace=np.linspace(1,10,10)
value=np.array([1,3,4,6])
np.searchsorted(array_linspace,value)
# >>>
array([0, 2, 3, 5], dtype=int64)


print(array_linspace)
print(value)
[ 1.  2.  3.  4.  5.  6.  7.  8.  9. 10.]
[1 3 4 6]

lexsort

one=np.array([6,2,4,1,2,3,4,5,6])
two=np.array([1,2,3,4,5,5,6,7,8])

result=np.lexsort([two,one])
result
array([3, 1, 4, 5, 2, 6, 7, 0, 8], dtype=int64)

数组形状

arange(i) 生成0到i的序列,不包括i
shape 维度/形状
reshape 重新设置形状
newaxis 新的维度
squeeze 去掉空维度
transpose/T 变化形状
concatenate 矩阵链接
vstack 垂直合并
hstack 水平合并
flatten
ravel

arange

array_arange=np.arange(10)
print(array_arange)
#>>>
[0 1 2 3 4 5 6 7 8 9]

shape

array_shape=np.arange(10)
array_shape.shape

#>>>
(10,)

reshape

array_reshape=np.arange(10)
array_reshape.reshape(1,10)  #大小必须不能改变 10个元素,变化后还是10个
#>>>
array([[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]])

数组的形状

arange(i) 生成0到i的序列,不包括i
shape 维度/形状
reshape 重新设置形状
newaxis 新的维度
squeeze 去掉空维度
transpose/T 变化形状
concatenate 矩阵链接
vstack 垂直合并
hstack 水平合并
flatten
ravel

arange

array_aange=np.arange(10)

#>>>
[0 1 2 3 4 5 6 7 8 9]

shape

array_shape=np.arange(10)
array_shape.shape

#>>>
(10,)

reshape

array_reshape=np.arange(10)
array_reshape.reshape(1,10) #大小必须不能改变 10个元素,变化后还是10个

#>>>
array([[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]])

newaxis

array_newaxis=np.arange(10)
array_newaxis=array_newaxis[np.newaxis,:]
print(array_newaxis)
print(array_newaxis.shape)


# >>>
[[0 1 2 3 4 5 6 7 8 9]]
(1, 10)


array_newaxis=np.arange(10)
array_newaxis=array_newaxis[:,np.newaxis]
print(array_newaxis)
print(array_newaxis.shape)

#>>>
[[0]
 [1]
 [2]
 [3]
 [4]
 [5]
 [6]
 [7]
 [8]
 [9]]
(10, 1)

squeeze

array_newaxis=np.arange(10)
array_newaxis=array_newaxis[:,np.newaxis,np.newaxis]
print(array_newaxis)
print(array_newaxis.shape)
#>>>
[[[0]]
 [[1]]
 [[2]]
 [[3]]
 [[4]]
 [[5]]
 [[6]]
 [[7]]
 [[8]]
 [[9]]]
(10, 1, 1)


array_squeeze=array_newaxis.squeeze()
print(array_squeeze)

#>>>
[0 1 2 3 4 5 6 7 8 9]

transpose 形状转换

array_transpose=np.array([[1,2,3,4,5],[2,3,4,5,6]])
array_transpose.transpose()

#>>>
array([[1, 2],
       [2, 3],
       [3, 4],
       [4, 5],
       [5, 6]])

concatenate数组链接

a=np.array([[1,2,3,4,5],[5,4,3,2,1]])
b=np.array([[0,9,8,7,6],[6,7,8,9,0]])

array_concatenate=np.concatenate((a,b))
print(array_concatenate)
#>>>
[[1 2 3 4 5]
 [5 4 3 2 1]
 [0 9 8 7 6]
 [6 7 8 9 0]]


array_concatnate_axis=np.concatenate((a,b),axis=1)
print(array_concatnate_axis)
#>>>
[[1 2 3 4 5 0 9 8 7 6]
 [5 4 3 2 1 6 7 8 9 0]]
array_concatnate_axis.shape
#>>>
(2, 10)

vstack 垂直合并

a=np.array([[1,2,3,4,5],[5,4,3,2,1]])
b=np.array([[0,9,8,7,6],[6,7,8,9,0]])

np.vstack((a,b))

#>>>
array([[1, 2, 3, 4, 5],
       [5, 4, 3, 2, 1],
       [0, 9, 8, 7, 6],
       [6, 7, 8, 9, 0]])

hstack 水平合并

np.hstack((a,b)) 水平合并
#>>>
array([[1, 2, 3, 4, 5, 0, 9, 8, 7, 6],
       [5, 4, 3, 2, 1, 6, 7, 8, 9, 0]])

flatten 合并成一行

array_flatten=np.array([[1,2,3,4],[4,5,6,7]])
array_flatten.flatten()
#>>>
array([1, 2, 3, 4, 4, 5, 6, 7])

revel合并成一行

array_ravel=np.array([[1,2,3,4],[4,5,6,7]])
array_ravel.ravel()
#>>>
array([1, 2, 3, 4, 4, 5, 6, 7])

数组的生成

arange
linspace
logspace
meshgrid
r_
c_
zeros
ones
empty
fill
zeros_like
ones_likes
identity 基准矩阵

range

array_arange=np.arange(10)
print(array_arange)
array_arang_b=np.arange(1,10,2)
print(array_arang_b)
array_arange_c=np.arange(1,10,5,dtype=np.float32)

#>>>
[0 1 2 3 4 5 6 7 8 9]
[1 3 5 7 9]

linspace

array_linspace=np.linspace(1,10) ##默认等差数列个数为 50。
print(array_linspace)
array_linpsace_a=np.linspace(1,10,2)

#>>>
 [1.          1.18367347  1.36734694  1.55102041  1.73469388  1.91836735
  2.10204082  2.28571429  2.46938776  2.65306122  2.83673469  3.02040816
  3.20408163  3.3877551   3.57142857  3.75510204  3.93877551  4.12244898
  4.30612245  4.48979592  4.67346939  4.85714286  5.04081633  5.2244898
  5.40816327  5.59183673  5.7755102   5.95918367  6.14285714  6.32653061
  6.51020408  6.69387755  6.87755102  7.06122449  7.24489796  7.42857143
  7.6122449   7.79591837  7.97959184  8.16326531  8.34693878  8.53061224
  8.71428571  8.89795918  9.08163265  9.26530612  9.44897959  9.63265306
  9.81632653 10.        ]

logspace

np.logspace(0,1,5)  # 10的0次幂到10的1次幂  5个等比列数据
#>>>
array([ 1.        ,  1.77827941,  3.16227766,  5.62341325, 10.        ])

meshgrid

x=np.linspace(-10,10,5)
print(x)
y=np.linspace(-20,20,5)
print(y)
#>>>
[-10.  -5.   0.   5.  10.]
[-20. -10.   0.  10.  20.]

x1,y1=np.meshgrid(x,y)
print(x1)
print(y1)

#>>>
[[-10.  -5.   0.   5.  10.]
 [-10.  -5.   0.   5.  10.]
 [-10.  -5.   0.   5.  10.]
 [-10.  -5.   0.   5.  10.]
 [-10.  -5.   0.   5.  10.]]

[[-20. -20. -20. -20. -20.]
 [-10. -10. -10. -10. -10.]
 [  0.   0.   0.   0.   0.]
 [ 10.  10.  10.  10.  10.]
 [ 20.  20.  20.  20.  20.]]

r_ row 行向量

np.r_[0:10:1]
#>>>
array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

c_ col 列向量

np.c_[0:10:1]

#>>>
array([[0],
       [1],
       [2],
       [3],
       [4],
       [5],
       [6],
       [7],
       [8],
       [9]])

zeros填充0

np.zeros(5)
array([0., 0., 0., 0., 0.])

np.zeros((5,5))
array([[0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.]])

ones填充1

np.ones(5)

#>>>
array([1., 1., 1., 1., 1.])

np.ones((5,5))

array([[1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1.]])

empty空地址

np.empty(5)
np.empty((5,5))

fill 自定义填充

a=np.empty((5,5))
a.fill(3)
print(a)
#>>>
[[3. 3. 3. 3. 3.]
 [3. 3. 3. 3. 3.]
 [3. 3. 3. 3. 3.]
 [3. 3. 3. 3. 3.]
 [3. 3. 3. 3. 3.]]

zeros_like ones_like

temp=np.arange(0,10,2)
print(temp)
#>>>
[0 2 4 6 8]

result=np.zeros_like(temp)
print(result)
#>>>
[0 0 0 0 0]

result_ones=np.ones_like(temp)
print(result_ones)
#>>>
[1 1 1 1 1]

identity 对角矩阵

np.identity(5)
#>>>

array([[1., 0., 0., 0., 0.],
       [0., 1., 0., 0., 0.],
       [0., 0., 1., 0., 0.],
       [0., 0., 0., 1., 0.],
       [0., 0., 0., 0., 1.]])