Python-Numpy

Catalog：Click to jump to the corresponding position

目录：

一、创建numpy的创建数组的三种方式

二、数组和列表的区别

八、排序函数、np.inld函数、unique去重函数

九、np数组数学函数、聚合函数、统计函数

十、numpy字符串操作、numpy删除

=.=.=.=.=.=.=.=.=.=.=.=.=.=.=.=.=.=.=.=.=.=.=.=.=.=.=.=.=.=.=.=.=.=.=.=.=

NumPy(Numerical Pythaon)是Python语言中做科学计算的基础库,重在于数值计算，也是大部分Python科学计算库的基础

Numpy模块多用于在大型、多维数组上执行的数值运算。

一、创建numpy的创建数组的三种方式

1.使用np.array()创建

-使用array()创建一个一维数组：

import numpy as np
arr = np.array([1,3,5,7,9])
arr

输出结果：

array([1, 3, 5, 7, 9])

-使用array()创建一个多维数组：

数组的维数：可以理解为嵌套的层级，比如一个列表对象中嵌套了一个列表，那么在数组下就是二维数组，列表对象如果没有嵌套，就是一维数组

2.使用plt创建

可以将外部的一张图片加载到Numpy数组中，然后可以进行裁剪、旋转等操作

import numpy as np
import matplotlib.pyplot as plt
img_arr = plt.imread('F:datayoona.jpg')  #返回的是数组，数组中装载的是图片内容
plt.imshow(img_arr)  #将numpy数组进行可视化展示

3.使用np的函数创建

import numpy as np
arr_1 = np.zeros(shape=(4,3))
arr_2 = np.ones(shape=(4,3))
arr_3 = np.linspace(0,10,num=5)
arr_4 = np.arange(10,20,step=2)
arr_5 = np.random.randint(0,50,size=(4,3))
print(arr_1,'

',arr_2,'

',arr_3,'

',arr_4,'

',arr_5)

输出结果：

二、数组和列表的区别

-数组中存储的数据元素类型必须是统一的类型

-数组中的元素类型有优先级：字符串>浮点数>整数

import numpy as np
arr_case=np.array([1,2,'three'])
arr_case.dtype

输出结果：dtype('<U11')

三、Numpy的常用属性

shape、ndim、size、dtype

import numpy as np
arr_case=np.random.randint(10,100,size=(5,4))
arr_case

arr_case.shape  #返回数组的形状
arr_case.ndim  #返回数组的维度
arr_case.size  #返回数组元素的个数
arr_case.dtype  #返回数组的类型

输出结果：

(5，4)

dtype('int32')

四、Numpy的数据类型

-array(dtype=x):可以设定数据类型

-arr.dtype = 'x':可以修改数据类型

-astype可以显式地转换数组的类型

import numpy as np
arr_case=np.random.randint(10,100,size=(5,4),dtype='int32')
arr_case.dtype   #输出结果：dtype('int32')
arr_case.dtype='int64'
arr_case.dtype

输出结果：dtype('int64')

import numpy as np
arr_case=np.random.randint(10,100,size=(5,4),dtype='int32')
arr = arr_case.astype(np.int64)
arr.dtype

输出结果：dtype('int64')

五、Numpy的索引和切片操作

import numpy as np
arr = np.random.randint(10,100,size=(5,4),dtype='int32')
arr

arr[0]  #取数组的第一行数据，数组的索引从0开始

输出结果：array([95, 61, 13, 78])

arr[0:2]  #取数组的第一行到第二行数据

输出结果：

arr[[0,2]]  #取数组的第一行和第三行数据，注意是两个列表框

输出结果：

arr[0,0]  #取数组的第一行，第一列的数据

输出结果：95

arr[0,[1,2]]  #取数组的第一行，第二列和第三列的数据

输出结果：array([61, 13])

arr[:,[1,2]]  #取数组的二列和第三列的数据

输出结果：

arr[:,0:3]  #取数组的一列到第三列的数据

输出结果：

arr[0:2,0:2]  #取数组的前两行前两列的数据

输出结果：

arr[::-1]  #取数组的行顺序进行倒转

输出结果：

arr[:,::-1]  #取数组的列顺序进行倒转

输出结果：

arr[[1,2],[1,2]]  #相当于arr[1,1]、arr[2,2]

输出结果：array([37, 47])

arr[[1,2]][:,[1,2]] #先取出第二行和第三行，在取出来的基础再上取第二列和第三列

输出结果：

六、关于图片数组的维度

import numpy as np
import matplotlib.pyplot as plt
img_arr = plt.imread('F:datayoona.jpg')
img_arr.ndim

输出结果：3

输出结果为3表示图片的数组维度有三个

img_arr.shape

输出结果：(1498, 1200, 3)

1498和1200表示像素的维度

3表示颜色的维度

七、Numpy数组形状变形

-reshape是返回一个新的数组对象，并不会改变原数组的内容

-resize也可以改变数组的形状，只不过resize会直接将原数组进行改变

-ravel将数组按照一定的方式降为一维数组，并不会改变原数组的内容

import numpy as np
arr = np.random.randint(1,50,size=(5,3))
arr

输出结果：

arr_1 = arr.reshape(15,)  #将二维数组降为一维
arr_1

输出结果:array([28, 16, 23, 34, 16, 25, 1, 32, 42, 25, 15, 17, 45, 18, 24])

arr_2 = arr.reshape(3,5)  #将 5行3列 改为 3行5列
arr_2

输出结果：

arr_3 = arr.reshape(3,-1)  #行或列只要有同一个数字确定，python会自动计算-1位置上的数字，前提是那个确定的数字能被原数组中的元素个数整除
arr_3                      #原数组5行3列一共15个元素，15可以整出3

输出结果：

arr_4 = arr.ravel()   #将原数组按照行的方向降为一维数组，不会改变原数组的形状
arr_4

输出结果：array([28, 16, 23, 34, 16, 25, 1, 32, 42, 25, 15, 17, 45, 18, 24])

arr_5 = arr.ravel(order='F')   #将原数组按照列的方向降为一维数组，不会改变原数组的形状
arr_5

输出结果：array([28, 34, 1, 25, 45, 16, 16, 32, 15, 18, 23, 25, 42, 17, 24])

arr.resize(3,5)  #resize也可以改变数组的形状，只不过resize会直接将原数组进行改变
arr

输出结果：

八、排序函数、np.inld函数、unique去重函数、np.where函数

排序函数: sort函数、argsort函数都可以进行排序,不过argsort返回的是从小到大的索引值

8.1 sort()函数

import numpy as np
arr = np.random.randint(1,50,size=(5,3))
arr

输出结果:

arr.sort()   #直接改变的是原数组，如果是多维数组，那么默认axis=1
arr

输出结果：

import numpy as np
arr = np.random.randint(1,50,size=(5,3))
arr

arr.sort(0)   #直接改变的是原数组，按照数组中的列排序
arr

arr.sort()都是从小到大进行排序的，如果想让从大到小进行排序，可以在排序之后使用切片操作达到目的

注意 arr.sort() 对应的是 arr[ : , : : -1 ]、arr.sort(0)对应的是arr[ : : -1 ]

arr[::-1] #在arr.sort()执行之后进行切片操作

8.2 argsort()函数

argsort返回的是从小到大的索引值，索引值从0开始

import numpy as np
arr = np.random.randint(1,50,size=(5,3))
arr

arr.argsort(0) #返回新的数组对象，不改变原数组，0表示按照列的方向

8.3np.in1d()函数

注意是in“一”d，你是in“L”d

import numpy as np
arr = np.random.randint(1,50,size=(5,3))
list_case=[12,5,4,8]
arr

返回结果：

np.in1d(arr,list_case)  #判断arr里的元素是否在list_case中，返回一个布尔值的数组

返回结果：array([False, False, False, False, False, False, False, True, False, False, False, True, True, True, False])

发现返回的结果是一个一维数组，不方便于我i们查看，我们此时可以将一维数组转化为与arr相同形状的数组

np.in1d(arr,list_case).reshape(5,3)

输出结果：

这样就方便我们与arr数组对照了

8.4unique()去重函数

import numpy as np
arr_1 = np.array([[1,3,4,5,7,9],[2,4,5,7,9,7],[1,3,4,5,8,9]])
arr_1

输出结果：

np.unique(arr_1) #计算arr_1的唯一值并排序

输出结果：array([1, 2, 3, 4, 5, 7, 8, 9])

8.5np.where函数

numpy.where() 有两种用法：

1. np.where(condition, x, y)

满足条件condition，输出x，不满足输出y

import pandas as pd
import numpy as np
arr = np.array(np.random.randint(1,20,size=(5,6)))
arr

输出结果：

np.where(arr[0:3]>15,'大于','小于') #arr的前三行的数据如果大于15，返回大于，否则返回小于

输出结果：

2. np.where(condition)

只有条件 (condition)，没有x和y，则输出满足条件元素的索引 (等价于numpy.nonzero)

这里的坐标以tuple的形式给出，通常原数组有多少维，输出的tuple中就包含几个数组，分别对应符合条件元素的各维坐标。

import pandas as pd
import numpy as np
arr = np.array(np.random.randint(1,20,size=(5,6)))
arr

输出结果：

np.where(arr>15)  #结果的第一行表示行索引，第二行表示列索引

输出结果：

九、np数组数学函数、聚合函数、统计函数

9.1常用数学函数：

sin()、cos()、tan() 和 around()

np.add(a,b）求和

np.divide(a,b）除法

np.subtract(a,b）减法

np.multiply(a,b）乘法

np.power(a,b)求幂

import numpy as np
np.sin(0.5)

输出结果：0.479425538604203

import numpy as np
arr = np.random.randint(1,50,size=(5,3))
np.sin(arr)  #对arr数组中的每一个元素求sin值

输出结果：

9.2常用聚合函数：

sum、max、min、mean平均值、cusum累计求和、argmin最小值的索引、argmax最大值的索引

import numpy as np
arr = np.random.randint(1,50,size=(5,3))
arr

输出结果：

np.sum(arr)  #将arr数组中的所有元素相加求和

输出结果：379

np.sum(arr,axis=0)  #将arr数组中的每一列的元素相加求和，axis=1表示每一行

输出结果：array([ 65, 157, 157])

np.argmin(arr,axis=0)  #返回数组中每一列元素最小值的索引

输出结果：array([2, 1, 0], dtype=int64)

9.3常用统计函数：

-numpy.ptp()计算数组中元素最大值与最小值的差（最大值 - 最小值）

-numpy.median()计算数组中元素的中位数（中值）

-numpy.std()计算数组中元素的标准差

-numpy.var()计算数组中元素的方差

import numpy as np
arr = np.random.randint(1,50,size=(5,3))
arr

输出结果：

np.std(arr) #求所有元素的标准差

输出结果：16.441681449562537

np.std(arr,axis=0)  #求数组中每一列元素的标准差

输出结果：array([10.17840852, 13.5735036 , 17.24644891])

关于标准差：

标准差是一组数据平均值分散程度的一种度量

上式为样本标准差，下式为总体标准差，二式差一个自由度,n与n-1。

一个班级学生身高的标准差，50个学生有50个身高数据，如求这个班级学生身高的标准差那么用总体标准差

如这50个身高数据作为全校学生的抽样，那么用样本标准差，因为这50个身高数据是全校学生的样本

十、numpy字符串操作、numpy删除

在numpy中调用字符串的方法，需要加char关键字，例如：np.char.upper()

import numpy as np
list_1=['hello','world']
list_2=['studay','running']

代码示例：

np.char.add(list_1,list_2)

输出结果：array(['hellostuday', 'worldrunning'], dtype='<U12')

np.char.multiply(list_1,2)

输出结果：array(['hellohello', 'worldworld'], dtype='<U10')

np.char.center('studay',12,'*')

输出结果：array('***studay***', dtype='<U12')

np.char.split('studay','u')

输出结果：array(list(['st', 'day']), dtype=object)

-numpy删除

使用np.delete(data,删除的行或列的索引,axis)函数

索引从0开始、axis=1表示列，axis=0表示行

numpy数组数据源：

df1_value

输出结果：

#删除第一列，返回一个新的视图，不会改变元数据的值
np.delete(df1_value,0,axis=1)

输出结果：

#删除多行，返回一个新的视图，不会改变元数据的值
np.delete(df1_value,[0,2,4],axis=0)

输出结果：

十一、级联操作

将多个numpy数组进行横向或纵向的连接

np.concatenate((数组1,数组2,……),axis=0/1)

axis参数的理解：0表示列、1表示行

两个数组横向连接时，行数必须相同，列数可以不同

两个数组纵向连接时，列数必须相同，行数可以不同

import numpy as np
arr_1 = np.random.randint(1,100,size=(5,3))
arr_2 = np.random.randint(1,100,size=(3,3))
arr_3 = np.random.randint(1,100,size=(1,3))

np.concatenate((arr_1,arr_2,arr_3),axis=0)

十二、数组的广播机制

一维数组广播机制：

import numpy as np
arr_1 = np.array([[1,3,5,7,9],[2,4,6,8,10]])
arr_1

输出结果：

arr_2 = np.array([1,1,1,1,1])
arr_2

输出结果：array([1, 1, 1, 1, 1])

arr_1+arr_2   #使用np.add(arr_1,arr_2)也行

二维数组广播机制:

注意：二维数组再进行广播运算时，必须有一个维度相同，要么是行数相同，列数不同，要么就是列数相同，行数相同，不能行数不同，列数也不同

十三、矩阵相关

numpy.eye(x) 函数返回给定大小的单位矩阵

import numpy as np
arr_1 = np.eye(5)
arr_1

arr_1.T   #矩阵的转置，行变成列，列变成行

矩阵相乘：

numpy.dot(a, b, out=None)

a 、 b 为两个数组

十四、numpy读取文件与保存

可以使用genfromtxt读取txt或者csv文件、也可以使用loadtxt读取txt或者csv文件

两个函数功能类似，genfromtxt针对的更多是结构化数据

array.txt源文件数据展示：

-genfromtxt

import numpy as np
data_1 = np.genfromtxt(r'F:dataarray.txt',delimiter=',',skip_header=1)
data_1

delimiter=',' 表示使用“,”将数据进行分隔

skip_header=1 表示不读取第一行

输出结果：

-loadtxt

data_2 = np.loadtxt(r'F:dataarray.txt',delimiter=',',skiprows=1)
data_2

delimiter=',' 表示使用“,”将数据进行分隔

skiprows=1 表示不读取第一行

-文件的保存

使用np.savetxt()函数

np.savetxt(保存地址，要保存的数据源，delimiter=分隔符，fmt=存储格式)

import numpy as npi
data_case = np.random.randint(1,10,size=(5,3))
data_case

输出结果：

np.savetxt(r'F:dataarray_case.txt',data_case,delimiter=',',fmt='%.2f')

输出结果：