[人工智能]Numpy全汇总

1. 概述

np.array() 将列表转换为数组

import numpy as np

array = [1, 2, 3, 4, 5]
array = np.array(array)

shape 打印矩阵的维度, 也可以使用np.shape

import numpy as np

array = [1, 2, 3, 4, 5]
array = np.array(array)
print(array.shape)

2. array 结构

dtype 打印数组的数据类型

import numpy as np 
np_array = [1, 2, 3, 4]
np_array = np.array(np_array)

print(np_array.dtype)

itemsize判断数组中每一个数字所占的字节数

print(np_array.itemsize)

size 打印出数组中的元素个数, 不关心矩阵的维度

print(np_array.size)

ndim 打印数组中的维度信息

print(np_array.ndim)

fill(0) 表示对当前数据进行填充，0表示填充的值

# .fill 对当前数据进行填充
np_array = np.array([1, 2])
np_array.fill(0)
print(np_array)

numpy索引与切片

np_array = np.array([1, 2, 3, 4])
print(np_array[0])
print(np_array[-2:])

copy 进行浅拷贝

np_array2 = np_array.copy()

dtype设置数组类型

将列表转换为bool值根据bool值进行取值操作

np_array = np.arange(0, 100, 10)
# 将列表转换为Bool值
bool_array = np.array([1, 0, 0, 1, 1, 1, 1, 0, 0, 0], dtype=bool)
# 根据bool值进行取值
print(np_array[bool_array])

根据大于或者小于获得bool值根据bool值进行取值操作

np_array = np.random.rand(10)
print(np_array)
bool_array = np_array > 0.5
print(bool_array)

np.where 对bool值进行操作

获得True的索引值

np_array = np.random.rand(10)
bool_array = np_array > 0.5
index = np.where(bool_array)
print(index)
print(np_array[index])

ndtype 输出字节数

print(np_array.nbytes)

astype 进行数据类型的转换但是实际数据不发生改变

np_array2 = np_array.astype(np.float32)
print(np_array2.dtype)

np.object格式保存了数据的原来格式

array = np.array([1, 10, 3.5, 'str'], dtype=np.object)

3. 数值计算

sum(axis=0) 进行数组的加和操作

import numpy as np

np_array = np.array([[1, 2, 3],
                       [4, 5, 6]])
# 对axis=0,进行行与行进行加和   1-行  0-列
print(np_array.sum(axis=0))
# 行-最小
print(np_array.min(axis=1))

# 所有
print(np_array.sum())
# -1 行
print(np_array.sum(axis=-1))

prod(axis=0) 进行数组之间的乘积操作,axis=0表示行与行之间进行乘积

print(np_array.prod())  # 所有元素进行相乘操作
print(np_array.prod(axis=1))

min(axis=0) 找出数组中数据最小的值，axis=0表示找出每一列的最小值,从上到下的操作

print(np_array.min(axis=0))

max(axis=0) 找出数组中数据最大值的操作

print(np_array.max(axis=0))

argmax(axis=1) 找出数组中每一行的最大值的位置

print(np_array.argmax(axis=1))

mean(axis=1) 找出数组中每一行均值的大小

print(np_array.mean(axis=1))

std(axis=1) 求出数组中每一行的标准差

print(np_array.std(axis=1))

var(axis=1) 求出数组中每一行的方差

print(np_array.var(axis=1))

clip(2, 4)进行数据的范围限制, 小于2的用2表示，大于4的用4表示

print(np_array.clip(2, 4))

round(decimals=1) 进行四舍五入，decimals表示保留小数点的后几位数

np_array = np.array([1.12, 2.12, 3.12, 4.6])
print(np_array.round(decimals=1))

4. 排序

np.sort(value, axis=0) 对数据进行排序操作

import numpy as np
np_array = np.array([[1.5, 1.3, 7.5],
                       [5.6, 7.8, 1.2]])
# 对每一列进行排序
print(np.sort(np_array, axis=0))

argsort(axis=0) 打印排序后的索引位置

print(np_array.argsort(axis=0))

np.linspace(0, 10, 11) # 进行范围的数据拆分

np_array = np.linspace(0, 10, 11)

np.searchsorted(np, value) # 将value插入np_array 返回的是插入后的索引值

print(np.searchsorted(np_array, value))

np.lexsort # 指定列队数组进行排序操作

np_array = np.array([[1, 0, 6],
                       [2, 7, 0],
                       [3, 3, 1],
                       [2, 4, 0]])

index = np.lexsort([np_array[:, 2]])
print(np_array[index])

5. 数组形状

np.reshape(value, (2, 5)) 进行矩阵的维度变化

np_array = np.arange(10)
print(np_array.shape)
# 通过.shape改变数据的维度
np_array.shape = 2, 5
print(np.reshape(np_array, (2, 5)))
print(np_array)

np.newaxis 表示增加一个矩阵维度

# 新增加一个维度 np.newaxis
np_array = np.array([[1, 2],
                       [3, 4]])
np_array = np_array[:, :, np.newaxis]
print(np_array.shape)

squeeze(axis=3) 表示指定一个维度进行去除

print(np_array.squeeze(axis=3).shape)

transpose() 表示进行转置操作

np_array = np.arange(0, 10, 1)
np_array.shape = 2, 5
print(np_array.transpose())

np.concatenate((a, b), axis=0) 进行矩阵的串接操作,(a, b)表示需要串接的tuple,axis=0进行上下的串接

a = np.array([[123, 456, 789], [3234, 456, 134]])
b = np.array([[123, 456, 789], [123, 546, 134]])
c = np.concatenate((a, b), axis=0)
print(c)

np.vstack((a, b)) 进行矩阵的上下位置上的串接

c = np.vstack((a, b))
print(c)

np.hstack((a, b)) 进行矩阵左右位置上的串接

c = np.hstack((a, b))
print(c)

flatten() 进行拉平操作,拉成一个维度

print(c.flatten())

ravel() 进行拉平操作,也是拉成一个维度

print(c.ravel())

6. 数组生成

np.arange(0, 10, 1) 0表示开始，10表示结束，1表示中间间隔

import numpy as np
# 根据np.arange进行数组1表示开始位置，10表示末位置, 2表示间隔
print(np.arange(1, 10, 2, dtype=np.float32))

np.linspace(0, 9, 10) 0表示起始位置,9表示结束，10表示拆分成10份

print(np.linspace(0, 9, 10))

np.logspace(0, 1, 11) 0表示起始位置, 1表示终止位置，11表示拆成11分，然后在输入

print(np.logspace(0, 1, 11))  #等价于10**0.1

np.meshgrid(x, y) 生成一个网格矩阵

x = np.linspace(0, 10, 11)
y = np.linspace(10, 20, 11)
x, y = np.meshgrid(x, y)
print(x)
print(y)

np.r_[0:10:1] 构造一个行向量

print(np.r_[0:10:1])

np.c_[0:10:1] 构造一个列向量

print(np.c_[0:10:1])

np.zeros(3)

import numpy as np
# np.zeros 构造一个零矩阵
print(np.zeros(3))
print(np.zeros((2, 3)))

np.ones((3, 3)) np.ones((3, 3)) 表示3*3的维度

print(np.ones((3, 3)))

np.empty(size) 生成一个空矩阵

a = np.empty(6)
print(a)

np.zeros_like() 生成一个维度相同的零矩阵

np_array = np.array([1, 2, 3, 4, 5])
np_array2 = np.zeros_like(np_array)
print(np_array2)

np.ones_like() 生成一个维度相同的1矩阵

np_array3 = np.ones_like(np_array)
print(np_array3)

np.identity(5) 生成一个形状是5的单位矩阵

print(np.identity(5))

7. 运算

np.multiply(x, y) 将x和y进行对应位置相乘操作

import numpy as np 

x = np.array([5, 5])
y = np.array([2, 2])
# np.multiply(x, y) 将x和y进行对应位置相乘操作
print(np.multiply(x, y))

np.dot(x, y) 将x和y进行点乘操作，即矩阵运算(2, 1) * (1, 2) = (2, 2)

print(np.dot(x.reshape(2, 1), y.reshape(1, 2)))

ndarray 四则运算

# 会进行数据的自动补全操作
x = np.array([1, 1, 1])
y = np.array([[1, 2, 3], [3, 4, 5]])
print(x + y)

np.logical_and 如果两个都是真的就是真

x = np.array([1, 0, 1])
y = np.array([1, 1, 0])
print(x==y)
print(np.logical_and(x, y))

np.logical_or 如果两个中有一个为真就是真

print(np.logical_or(x, y))

np.logical_not 如果第二个数为1就是1，否者两个数都为0，等于1

print(np.logical_not(x, y))

8. 随机矩阵

np.random.rand(3, 2) 构造一个(3, 2)的随机矩阵

import numpy as np
# 构造一个0，1之间的随机矩阵
print(np.random.rand(3, 2))

np.random.randint(0, 3, size=(2, 5)) 构造一个0到2的随机整数矩阵，矩阵的维度是2，5

print(np.random.randint(0, 3, size=(5, 4)))

np.random.sample() 返回一个0到1的随机数

print(np.random.sample())

np,random.uniform(0, 3, size=(2, 5)) 从一个均匀的分布中随机取值

print(np.random.uniform(0, 1, size=(1, 1)))

np.random.normal(mu, sigma, size) 根据均值和标准差进行随机生成高斯矩阵

m = 0
sigma = 0.1 #标准差
print(np.random.normal(m, sigma, size=(10, 1)))

np.set_printoptions(precision=3) 进行输出的精度设置，3表示的小数点的个数

np.set_printoptions(precision=3)
mu, sigma = 0, 0.1
n = np.random.normal(mu, sigma, 10)
print(n)

np.random.shuffle() 对样本进行洗牌操作

np_array = np.arange(0, 10, 1)
np.random.shuffle(np_array)
print(np_array)

np.random.seed(100) 设置随机种子，让每次随机获的参数的结果相同，为了更好的进行对比

np.random.seed(100)

x = np.random.normal(0, 0.1, size=(1, 10))
print(x)

9. 读写

np.loadtxt('np.txt', delimiter=",", skiprows=1), delimiter 表示分割符， skiprows表示去除第一行, usecols指定使用那几列数据

y = np.loadtxt('np.txt', delimiter=',', skiprows=1)
print(y)

np.savetxt('np2.txt', np_array, fmt='%.2f', delimiter=',')

np_array = np.array([[1, 2, 3], [4, 5, 6]], dtype=np.float32)
np.savetxt('np2.txt', np_array, fmt='%.2f', delimiter=',')

进行单个array参数的载入和读取，保存的格式是npy

np_array = np.array([1, 2, 3, 4], dtype=np.float32)

np.save('np3.npy', np_array)  # 写入文件

np_array = np.load('np3.npy')  # 读取文件
print(np_array)

进行多个array参数的载入和读取，使用的是np.savez，保存的格式是.npz,读取时使用key

np_array = np.array([1, 2, 3, 4], dtype=np.float32)
np_array2 = np.array([4, 5, 6, 7], dtype=np.float32)

np.savez('np.npz', a=np_array, b=np_array2)

data = np.load('np.npz')
print(data['a'])
print(data['b'])

10. 练习题

np.version 打印numpy当前的版本

import numpy as np
print(np.__version__)

构造一个全零矩阵，并打印其所占内存数

z = np.zeros((5, 5))
print(z.size * z.itemsize)
print(z.nbytes)

打印一个函数的帮助文档 help(np.info(np,add))

print(help(np.info(np.add)))

创建一个10-49的数组，并将其倒序排列

np_array = np.arange(10, 50, 1)
np = np_array[::-1]
print(np)

np.nonzero(np_array) 找出一个数组中不为0的索引值

print(np.nonzero([1, 2, 3, 4, 5, 0, 0, 3]))

随机构造一个3*3矩阵，打印其最大值和最小值

np.random.seed(9)
np_array = np.random.randint(0, 10, size=(5, 6))
print(np_array.min())
print(np_array.max())

np.pad(np_array, add_size, 'constant', constant_values=0) 构造一个5*5的矩阵，令其值为1，在最外层加上一圈0

np_array = np.ones((5, 5))
np_array2 = np.pad(np_array, 1, 'constant', constant_values=0)
print(np_array2)

np.unravel_index(100, (6, 7, 8)) 构建一个shape为(6, 7, 8)的矩阵，并找出第100个元素的索引值

print(np.unravel_index(100, (6, 7, 8)))

对一个5*5矩阵做0到1归一化操作

np_array = np.random.random((5, 5))
np_array = (np_array - np_array.min()) / (np_array.max() - np_array.min())

np.intersect1d(z1, z2) 找出两个数组相同的数

 np.random.randint(0, 11, 10)
z2 = np.random.randint(0, 11, 10)
print(np.intersect1d(z1, z2))

np.datetime64('today', 'D') np.timedelta64(1, 'D') # 得到昨天今天明天

yesterday = np.datetime64('today', 'D') - np.timedelta64(1, 'D')
today = np.datetime64('today', 'D')
tomorrow = np.datetime64('today', 'D') + np.timedelta64(1, 'D')
print(yesterday)

得到一个月中所有的天数

print(np.arange('2017-10', '2017-11', dtype='datetime64[D]'))

np.floor(value) 取出一个数的整数部分

np_array = np.random.uniform(0, 10, 10)
print(np.floor(np_array))

z.flags.writeable 使得这个数组不能被改变

z = np.zeros(5)
z.flags.writeable = False
z[0] = 1

np.set_printoptin(threshold=np.nan) 使得数组全部打印出来

np.set_printoptions(threshold=np.nan)
z = np.zeros((5, 5))
print(z)

在一个数组中，找出最接近一个数的索引

z = np.arange(100)
v = np.random.uniform(0, 100)
print(v)
index = np.abs(z - v).argmin()
print(index)

进行float32与int32的类型转换

z = np.arange(10, dtype=np.float32)
l = z.astype(np.int32)
print(l.dtype)

打印数组的元素坐标与值

z = np.arange(9).reshape(3, 3)
for index, value in np.ndenumerate(z):
    print(index, value)

按照数组的某一列进行排序

z = np.random.randint(0, 10, (4, 3))
print(z[z[:, 1].argsort()])

np.bincount(np_array) 统计数组中元素的个数

z = np.array([1, 1, 1, 2, 2, 3, 4, 5])
print(np.bincount(z))

对最后两个维度进行加和操作

np_array = np.random.randint(0, 10, (4, 4, 4, 4))
print(np_array.sum(axis=(-2, -1)))

交换矩阵的两行

np_array = np.random.randint(0, 10, (3, 4))
np_array[[1, 2]] = np_array[[2, 1]]
print(np_array)

找出数组中最常出现的数字

z = np.random.randint(0, 10, 10)
print(np.bincount(z).argmax())

np.argpartition(-z, n)[:n] 找出K个最大值的索引和值

z = np.arange(10000)
np.random.shuffle(z)
n = 5
print(np.argpartition(-z, n)[:n])

np.all(x==y, aixs=1) 找出一行中都相同的数，打印True

# 找出所有元素都相同的数据
x = np.array([[1, 1]])
p = np.array([[1, 1]])
print(np.all(x == p, axis=1))

z = np.random.randint(0, 5, (10, 3))
print(np.all(z[:, 1:]==z[:, :-1]))

参考

https://www.cnblogs.com/my-love-is-python/p/10221374.html