玩转NumPy数组

一、Numpy 数值类型

　　1、前言：Python 本身支持的数值类型有 int（整型， long 长整型）、float（浮点型）、bool（布尔型）和 complex（复数型）。而 Numpy 支持比 Python 本身更为丰富的数值类型，细分如下：

　　2、bool：布尔类型，1 个字节，值为 True 或 False。

　　3、int：整数类型，通常为 int64 或 int32 。

　　4、intc：与 C 里的 int 相同，通常为 int32 或 int64。

　　5、intp：用于索引，通常为 int32 或 int64。

　　6、int8：字节（从 -128 到 127）

　　7、int16：整数（从 -32768 到 32767）

　　8、int32：整数（从 -2147483648 到 2147483647）

　　9、int64：整数（从 -9223372036854775808 到 9223372036854775807）

　　10、uint8：无符号整数（从 0 到 255）

　　11、uint16：无符号整数（从 0 到 65535）

　　12、uint32：无符号整数（从 0 到 4294967295）

　　13、uint64：无符号整数（从 0 到 18446744073709551615）

　　14、float：float64 的简写。

　　15、float16：半精度浮点，5 位指数，10 位尾数

　　16、float32：单精度浮点，8 位指数，23 位尾数

　　17、float64：双精度浮点，11 位指数，52 位尾数complex：complex128 的简写。

　　18、complex64：复数，由两个 32 位浮点表示。

　　19、complex128：复数，由两个 64 位浮点表示。

　　20、总结：

　　eg:设置数值类型

　　import numpy as np

　　a = np.array([1.1, 2.2, 3.3], dtype=np.float64) # 指定 1 维数组的数值类型为 float64

　　此处输入图片的描述

　　eg:.通过astype() 方法转换数值类型。

　　此处输入图片的描述

　　eg：通过 .dtype 方法来查看 dtype 数值类型。

　　此处输入图片的描述

　　注释：在 Numpy 中，上面提到的这些数值类型都被归于 dtype（data-type）对象的实例。可以通过 numpy.dtype(object, align, copy) 来指定数值类型。而在数组里面，可以用 dtype= 参数来设置数值类型。

二、Numpy数组

　　1、数组介绍

　　　　1、一维数组的介绍

　　　　　　在 python 内建对象中，数组有三种形式：list 列表,Tuple 元组,)Dict 字典。其中，元组与列表相似，不同之处在于元组的元素不能修改。而字典由键和值构成。python 标准类针对数组的处理局限于 1 维，并仅提供少量的功能。

　　　　2、多维数组的介绍

　　　　 Numpy 最核心且最重要的一个特性就是 ndarray 多维数组对象，它区别于 python 的标准类，拥有对高维数组的处理能力，这也是数值计算过程中缺一不可的重要特性。Numpy 中，ndarray 类具有六个参数，它们分别为：shape：数组的形状。dtype：数据类型。buffer：对象暴露缓冲区接口。offset：数组数据的偏移量。strides：数据步长。order：{'C'，'F'}，以行或列为主排列顺序。

　　　　3、数组特性

　　　　 NumPy数组的下标从0开始。
　　　　同一个NumPy数组中所有元素的类型必须是相同的。

　　2.2创建数组方式

　　1、使用 numpy.array 将列表或元组转换为 ndarray 数组，

　　格式：numpy.array(object, dtype=None, copy=True, order=None, subok=False, ndmin=0)

　　注释：object：列表、元组等。dtype：数据类型。如果未给出，则类型为被保存对象所需的最小类型。copy：布尔来写，默认 True，表示复制对象。order：顺序。subok：布尔类型，表示子类是否被传递。ndmin：生成的数组应具有的最小维数。

　　案例：

　　　　1、通过列表的方式转换：

　　　　import numpy as np
　　　　np.array([[[1, 2, 3],[1, 2, 3],[1, 2, 3]],[[1, 2, 3],[1, 2, 3],[1, 2, 3]],[[1, 2, 3],[1, 2, 3],[1, 2, 3]]])

　　　　此处输入图片的描述

　　　　2、通过元组的方式转换

　　　　import numpy as np
　　　　np.array([(1,2),(3,4),(5,6)])

　　　　此处输入图片的描述

　　2 arange 方法创建

　　　　格式：numpy.arange(start, stop, step, dtype=None)

　　　　注释：设置值所在的区间，即（开始，停止），并且这是一个半开半闭区间即顾头不顾尾。然后设置 step 步长用于设置值之间的间隔。最后的可选参数 dtype可以设置返回ndarray 的值类型。

　　　　案例：在区间 [3, 7) 中以 0.5 为步长新建数组

　　　　import numpy as np
　　　　np.arange(3, 7, 0.5, dtype=float32)

　　　　此处输入图片的描述

　　3、 linspace 方法创建

linspace方法也可以像arange方法一样，创建数值有规律的数组。linspace 用于在指定的区间内返回间隔均匀的值。其方法如下：

　　格式：numpy.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None)

　　注释：start：序列的起始值。stop：序列的结束值。num：生成的样本数。默认值为50。endpoint：布尔值，如果为真，则最后一个样本包含在序列内。retstep：布尔值，如果为真，返回间距。dtype：数组的类型。

　　案例：

　　import numpy as np
　　np.linspace(0, 10, 10, endpoint=True)
　　np.linspace(0, 10, 10, endpoint=False)

　　　　此处输入图片的描述

　　4、 ones 方法创建

　　numpy.ones 用于快速创建数值全部为 1 的多维数组。其方法如下：

　　格式：numpy.ones(shape, dtype=None, order='C')

　　注释：shape：用于指定数组形状，例如（1， 2）或 3。dtype：数据类型。order：{'C'，'F'}，按行或列方式储存数组。

　　案例：

　　import numpy as np
　　np.ones((2,3))

　　　　此处输入图片的描述

　　5、 zeros 方法创建

　　zeros 方法和上面的 ones 方法非常相似，不同的地方在于，这里全部填充为 0。zeros 方法和 ones 是一致的。

　　格式：numpy.zeros(shape, dtype=None, order='C')

　　注释：shape：用于指定数组形状，例如（1， 2）或3。dtype：数据类型。order：{'C'，'F'}，按行或列方式储存数组。

　　案例：

　　import numpy as np
　　np.zeros((3,2))

　　　　此处输入图片的描述

　　6、 eye 方法创建

　　numpy.eye 用于创建一个二维数组，其特点是k 对角线上的值为 1，其余值全部为0。方法如下：

　　格式：numpy.eye(N, M=None, k=0, dtype=)

　　注释：N：输出数组的行数。M：输出数组的列数。k：对角线索引：0（默认）是指主对角线，正值是指上对角线，负值是指下对角线。

　　案例：

　　import numpy as np
　　np.eye(5, 4, 3)

　　　　此处输入图片的描述

　　7、从已知数据创建

　　我们还可以从已知数据文件、函数中创建 ndarray。numpy 提供了下面 5 个方法：

　　frombuffer（buffer）：将缓冲区转换为 1 维数组。fromfile（file，dtype，count，sep）：从文本或二进制文件中构建多维数组。fromfunction（function，shape）：通过函数返回值来创建多维数组。fromiter（iterable，dtype，count）：从可迭代对象创建 1 维数组。fromstring（string，dtype，count，sep）：从字符串中创建 1 维数组。

　　案例：

　　import numpy as np
　　np.fromfunction(lambda a, b: a + b, (5, 4))

　　　　此处输入图片的描述

三、ndarray 数组属性

　　1、创建一个多维数组

　　import numpy as np
　　a = np.array([[[1, 2, 3],[1, 2, 3],[1, 2, 3]],[[1, 2, 3],[1, 2, 3],[1, 2, 3]],[[1, 2, 3],[1, 2, 3],[1, 2, 3]]])

　　　　此处输入图片的描述

　　2、ndarray.T属性

　　　　注释：ndarray.T用于数组的转置，与 .transpose() 相同。

　　　 案例：

　　　　此处输入图片的描述

　　3、 ndarray.dtype属性

　　　　注释：ndarray.dtype 用来输出数组包含元素的数据类型。

　　　　案例：

　　　　此处输入图片的描述

　　4、ndarray.imag属性

　　　　注释：ndarray.imag 用来输出数组包含元素的虚部。

　　　　案例：

　　　　　此处输入图片的描述

　　5、ndarray.real属性

　　　　注释：ndarray.real用来输出数组包含元素的实部。

　　　　案例：

　　　　　此处输入图片的描述

　　6、 ndarray.size属性

　　　　注释：ndarray.size用来输出数组中的总包含元素数。

　　　　案例：

　　　　此处输入图片的描述

　　7、ndarray.itemsize属性

　　　　注释：ndarray.itemsize输出一个数组元素的字节数。

　　　　案例：

　　　　此处输入图片的描述

　　8、ndarray.nbytes属性

　　　　注释：ndarray.nbytes用来输出数组的元素总字节数。

　　　　案例：

　　　　此处输入图片的描述

　　9、 ndarray.ndim属性

　　　　注释：ndarray.ndim用来输出数组尺寸。

　　　　案例：

　　　　此处输入图片的描述

　　10、ndarray.shape属性

　　　　注释：ndarray.shape用来输出数组维数组.

　　　　案例：

　　　　此处输入图片的描述

　　11、 ndarray.strides属性

　　　　注释：ndarray.strides用来遍历数组时，输出每个维度中步进的字节数组。

　　　 案例：

　　　　此处输入图片的描述

四、Numpy 数组的基本操作

　　1、重设形状

reshape 可以在不改变数组数据的同时，改变数组的形状。其中，numpy.reshape() 等效于 ndarray.reshape()。reshape 方法非常简单：

　　格式：numpy.reshape(a, newshape)

　　注释：a 表示原数组，newshape 用于指定新的形状(整数或者元组)。

　　案例：

　　import numpy as np

　　np.arange(10).reshape((5, 2))

　　　　此处输入图片的描述

　　2、数组展开

　　 ravel 的目的是将任意形状的数组扁平化，变为 1 维数组。ravel 方法如下：

 　格式：numpy.ravel(a, order='C')

　　注释：a 表示需要处理的数组。order 表示变换时的读取顺序，默认是按照行依次读取，当 order='F' 时，可以按列依次读取排序。

　　案例：

　　import numpy as np
　　a = np.arange(10).reshape((2, 5))
　　np.ravel(a)
　　np.ravel(a, order='F')

　　　　此处输入图片的描述

　　3、轴移动

　　moveaxis 可以将数组的轴移动到新的位置。其方法如下：

　　格式：numpy.moveaxis(a, source, destination)

　　注释：a：数组。source：要移动的轴的原始位置。destination：要移动的轴的目标位置。

　　案例：

　　import numpy as np

　　a = np.ones((1, 2, 3))

　　np.moveaxis(a, 0, -1)

　　此处输入图片的描述

　　你可能没有看明白是什么意思，我们可以输出二者的 shape属性：

　　此处输入图片的描述

　　4、轴交换

　　和 moveaxis 不同的是，swapaxes 可以用来交换数组的轴。其方法如下：

　　格式：numpy.swapaxes(a, axis1, axis2)

　　注释：a：数组。axis1：需要交换的轴 1 位置。axis2：需要与轴 1 交换位置的轴 1 位置。

　　案例：

　　import numpy as np
　　a = np.ones((1, 4, 3))
　　np.swapaxes(a, 0, 2)

　　我们直接输出两个数组的 shape 值。

　　此处输入图片的描述

　　5、数组转置

　　transpose 类似于矩阵的转置，它可以将 2 维数组的横轴和纵轴交换。其方法如下：

　　格式：numpy.transpose(a, axes=None)

　　注释：a：数组。axis：该值默认为 none，表示转置。如果有值，那么则按照值替换轴。

　　案例：

　　import numpy as np
　　a = np.arange(4).reshape(2,2)
　　np.transpose(a)

　　此处输入图片的描述

　　6、维度改变

　　atleast_xd 支持将输入数据直接视为 x维。这里的 x 可以表示：1，2，3。方法分别维：

　　numpy.atleast_1d()
　　numpy.atleast_2d()
　　numpy.atleast_3d()
　　案例：
　　import numpy as np
　　np.atleast_1d([1])
　　np.atleast_2d([1])
　　np.atleast_3d([1])

　　此处输入图片的描述

　　7、类型转变

在 numpy 中，还有一系列以 as 开头的方法，它们可以将特定输入转换为数组，亦可将数组转换为矩阵、标量，ndarray 等。如下：

asarray(a，dtype，order)：将特定输入转换为数组。asanyarray(a，dtype，order)：将特定输入转换为 ndarray。asmatrix(data，dtype)：将特定输入转换为矩阵。asfarray(a，dtype)：将特定输入转换为 float 类型的数组。asarray_chkfinite(a，dtype，order)：将特定输入转换为数组，检查 NaN 或 infs。asscalar(a)：将大小为 1 的数组转换为标量。

这里以 asmatrix(data，dtype) 方法举例：

import numpy as np

a = np.arange(4).reshape(2,2)
np.asmatrix(a)

此处输入图片的描述

　　8、数组连接

concatenate 可以将多个数组沿指定轴连接在一起。其方法为：

numpy.concatenate((a1, a2, ...), axis=0)

其中：

(a1, a2, ...)：需要连接的数组。axis：指定连接轴。

举个例子：

import numpy as np

a = np.array([[1, 2], [3, 4], [5, 6]])
b = np.array([[7, 8], [9, 10]])
c = np.array([[11, 12]])

np.concatenate((a, b, c), axis=0)

此处输入图片的描述

这里，我们可以尝试沿着横轴连接。但要保证连接处的维数一致，所以这里用到了 .T 转置。

a = np.array([[1, 2], [3, 4], [5, 6]])
b = np.array([[7, 8, 9]])

np.concatenate((a, b.T), axis=1)

此处输入图片的描述

2.9 数组堆叠

在 numpy 中，还有一系列以 as 开头的方法，它们可以将特定输入转换为数组，亦可将数组转换为矩阵、标量，ndarray 等。如下：

stack(arrays，axis)：沿着新轴连接数组的序列。column_stack()：将 1 维数组作为列堆叠到 2 维数组中。hstack()：按水平方向堆叠数组。vstack()：按垂直方向堆叠数组。dstack()：按深度方向堆叠数组。

这里以 stack(arrays，axis) 方法举例：

import numpy as np

a = np.array([1, 2, 3])
b = np.array([4, 5, 6])
np.stack((a, b))

此处输入图片的描述

当然，也可以横着堆叠。

np.stack((a, b), axis=-1)

此处输入图片的描述

2.10 拆分

split 及与之相似的一系列方法主要是用于数组的拆分，列举如下：

split(ary，indices_or_sections，axis)：将数组拆分为多个子数组。dsplit(ary，indices_or_sections)：按深度方向将数组拆分成多个子数组。hsplit(ary，indices_or_sections)：按水平方向将数组拆分成多个子数组。vsplit(ary，indices_or_sections)：按垂直方向将数组拆分成多个子数组。

下面，我们看一看 split 到底有什么效果：

import numpy as np

a = np.arange(10)
np.split(a, 5)

此处输入图片的描述

除了 1 维数组，更高维度也是可以直接拆分的。例如，我们可以将下面的数组按行拆分为 2。

import numpy as np

a = np.arange(10).reshape(2,5)
np.split(a, 2)

此处输入图片的描述

numpy 中还有针对数组元素添加或移除的一些方法。

2.11 删除

delete(arr，obj，axis)：沿特定轴删除数组中的子数组。

下面，依次对 4 种方法进行示例，首先是 delete 删除：

import numpy as np

a = np.arange(12).reshape(3,4)
np.delete(a, 2, 1)

这里代表沿着横轴，将第 3 列(索引 2)删除。

此处输入图片的描述

当然，你也可以沿着纵轴，将第三行删除。

np.delete(a, 2, 0)

此处输入图片的描述

2.12 数组插入

insert(arr，obj，values，axis)：依据索引在特定轴之前插入值。

再看一看 insert插入, 用法和 delete 很相似，只是需要在第三个参数位置设置需要插入的数组对象：

import numpy as np

a = np.arange(12).reshape(3,4)
b = np.arange(4)

np.insert(a, 2, b, 0)

此处输入图片的描述

2.13 附加

append(arr，values，axis)：将值附加到数组的末尾，并返回 1 维数组。

append 的用法也非常简单。只需要设置好需要附加的值和轴位置就好了。它其实相当于只能在末尾插入的 insert，所以少了一个指定索引的参数。

import numpy as np

a = np.arange(6).reshape(2,3)
b = np.arange(3)

np.append(a, b)

注意 append方法返回值，默认是展平状态下的 1 维数组。

此处输入图片的描述

2.14 重设尺寸

resize(a，new_shape)：对数组尺寸进行重新设定。

resize 就很好理解了，直接举例子吧：

import numpy as np

a = np.arange(10)
a.resize(2,5)

此处输入图片的描述

你可能会纳闷了，这个 resize 看起来和上面的 reshape 一样呢，都是改变数组原有的形状。

其实，它们直接是有区别的，区别在于对原数组的影响。reshape 在改变形状时，不会影响原数组，相当于对原数组做了一份拷贝。而 resize 则是对原数组执行操作。

此处输入图片的描述

2.15 翻转数组

在 numpy 中，我们还可以对数组进行翻转操作：

fliplr(m)：左右翻转数组。flipud(m)：上下翻转数组。

举个例子：

import numpy as np

a = np.arange(16).reshape(4,4)
n.fliplr(a)
n.flipud(a)

此处输入图片的描述

三、Numpy 随机抽样

Numpy 的随机抽样功能非常强大，主要由 numpy.random 模块完成。

首先，我们需要了解如何使用 numpy 也就是生成一些满足基本需求的随机数据。主要由以下一些方法完成：

3.1 numpy.random.rand

numpy.random.rand(d0, d1, ..., dn) 方法的作用为：指定一个数组，并使用 [0, 1) 区间随机数据填充，这些数据均匀分布。

import numpy as np

np.random.rand(2,5)

此处输入图片的描述

3.2 numpy.random.randn

numpy.random.randn(d0, d1, ..., dn) 与 numpy.random.rand(d0, d1, ..., dn) 的区别在于，返回的随机数据符合标准正太分布。

import numpy as np

np.random.randn(1,10)

此处输入图片的描述

3.3 numpy.random.randint

randint(low, high, size, dtype) 方法将会生成 [low, high) 的随机整数。注意这是一个半开半闭区间。

import numpy as np

np.random.randint(2,5,10)

此处输入图片的描述

3.4 numpy.random.random_integers

random_integers(low, high, size) 方法将会生成 [low, high] 的 np.int 类型随机整数。注意这是一个闭区间。

import numpy as np

np.random.random_integers(2,5,10)

此处输入图片的描述

3.5 numpy.random.random_sample

random_sample(size) 方法将会在 [0, 1) 区间内生成指定 size 的随机浮点数。

import numpy as np

np.random.random_sample([10])

此处输入图片的描述

与 numpy.random.random_sample 类似的方法还有：

numpy.random.random([size])numpy.random.ranf([size])numpy.random.sample([size])

它们 4 个的效果都差不多。

3.6 numpy.random.choice

choice(a, size, replace, p) 方法将会给定的 1 维数组里生成随机数。

import numpy as np

np.random.choice(10,5)

上面的代码将会在 np.arange(10) 中生成 5 个随机数。

此处输入图片的描述

3.7 概率密度分布

除了上面介绍的 6 中随机数生成方法，numpy 还提供了大量的满足特定概率密度分布的样本生成方法。它们的使用方法和上面非常相似，这里就不再一一介绍了。列举如下：

numpy.random.beta(a，b，size)：从 Beta 分布中生成随机数。

numpy.random.binomial(n, p, size)：从二项分布中生成随机数。

numpy.random.chisquare(df，size)：从卡方分布中生成随机数。

numpy.random.dirichlet(alpha，size)：从 Dirichlet 分布中生成随机数

。numpy.random.exponential(scale，size)：从指数分布中生成随机数。

numpy.random.f(dfnum，dfden，size)：从 F 分布中生成随机数。

numpy.random.gamma(shape，scale，size)：从 Gamma 分布中生成随机数。

numpy.random.geometric(p，size)：从几何分布中生成随机数。

numpy.random.gumbel(loc，scale，size)：从 Gumbel 分布中生成随机数。

numpy.random.hypergeometric(ngood, nbad, nsample, size)：从超几何分布中生成随机数。

numpy.random.laplace(loc，scale，size)：从拉普拉斯双指数分布中生成随机数。

numpy.random.logistic(loc，scale，size)：从逻辑分布中生成随机数。

numpy.random.lognormal(mean，sigma，size)：从对数正态分布中生成随机数。

numpy.random.logseries(p，size)：从对数系列分布中生成随机数。

numpy.random.multinomial(n，pvals，size)：从多项分布中生成随机数。

numpy.random.multivariate_normal(mean, cov, size)：从多变量正态分布绘制随机样本。

numpy.random.negative_binomial(n, p, size)：从负二项分布中生成随机数。

numpy.random.noncentral_chisquare(df，nonc，size)：从非中心卡方分布中生成随机数。

numpy.random.noncentral_f(dfnum, dfden, nonc, size)：从非中心 F 分布中抽取样本。

numpy.random.normal(loc，scale，size)：从正态分布绘制随机样本。

numpy.random.pareto(a，size)：从具有指定形状的 Pareto II 或 Lomax 分布中生成随机数。

numpy.random.poisson(lam，size)：从泊松分布中生成随机数。

numpy.random.power(a，size)：从具有正指数 a-1 的功率分布中在 0，1 中生成随机数。

numpy.random.rayleigh(scale，size)：从瑞利分布中生成随机数。

numpy.random.standard_cauchy(size)：从标准 Cauchy 分布中生成随机数。

numpy.random.standard_exponential(size)：从标准指数分布中生成随机数。

numpy.random.standard_gamma(shape，size)：从标准 Gamma 分布中生成随机数。

numpy.random.standard_normal(size)：从标准正态分布中生成随机数。

numpy.random.standard_t(df，size)：从具有 df 自由度的标准学生 t 分布中生成随机数。

numpy.random.triangular(left，mode，right，size)：从三角分布中生成随机数。

numpy.random.uniform(low，high，size)：从均匀分布中生成随机数。

numpy.random.vonmises(mu，kappa，size)：从 von Mises 分布中生成随机数。

numpy.random.wald(mean，scale，size)：从 Wald 或反高斯分布中生成随机数。

numpy.random.weibull(a，size)：从威布尔分布中生成随机数。numpy.random.zipf(a，size)：从 Zipf 分布中生成随机数。

六、数组运算

　　1、数组文件输入输出

　　　　np.save方法

　　　　　　arr = np.arange(10)

　　　　　　np.save('some_array',arr)

　　　　np.load方法函数是读写磁盘的两个主要函数，默认情况下，数组以未压缩的原始二进制格式保存在扩展名为.npy的文件中

　　　　　　np.load('some_array.npy')

　　　　　　 array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

　　　　　　arr = np.loadtxt('dataMatrix.txt',delimiter=' ')

　　2、numpy索引与切片

　　index 和slicing ：第一数值类似数组横坐标，第二个为纵坐标