python——numpy库

numpy库

英文官方文档：https://docs.scipy.org/doc/numpy/reference/arrays.ndarray.html

一、numpy库中的数组对象
二、numpy库数据存取与文件
三、numpy库的随机函数
四、numpy的统计函数
五、梯度函数

一、numpy库中的数组对象：N维数组类型：ndarray

　　1) ndarray的作用：

　　　　a) 数组对象性可以去掉元素间运算所需的循环，使一维向量更像单个数据。

　　　　b) 设置专门的数组对象，经过优化，可以提升这类应用的运算速度。

　　2) ndarray是一个多维数组对象，有两部分组成：

　　　　实际的数据和描述这些数据的元数据（数据维度、数据类型等）

ndarray数组一般要求所有元素类型相同（同质），数组下标从零开始

　　3) ndarray实例对象的属性：

　　　　.ndim：秩，即轴的数量或维度的数量

　　　　.shape：ndarray对象的尺度，对于矩阵，n行m列

　　　　.size：ndarray对象元素的个数，相当于.shape中的n*m

　　　　.dtype：ndarray对象的元素类型

　　　　.itemsize：ndarray对象中的每个元素的大小，以字节为单位

　　4) ndarray的元素类型：

数据类型	说明
bool	布尔类型，True or False
intc	与C语言中的int类型一致Int32或int6
intp	用于索引的整数，与C语言中的ssize_t一致，int2或int64
int8	8字节长度的整数，取值[-128,127]
int16/int32/int64	类似int8
uint8	8位无符正数，取值[0,255]
uint16/uint32/uint64	类似uint8
float16	16位半精度浮点数:1位符号位,5位指数(10^指数),10位尾数
float32	类似float16；1为符号位，8位指数，23位尾数
float64	类似float16；1为符号位，11位指数，52位尾数
complex64	复数类型，实部和虚部都是32位浮点数
complex128	复数类型，实部和虚部都是64位浮点数

对比：python语法只支持整数，浮点数和复数3种类型

而科学计算对数据的类型，精度都有较高要求

注意：非同质的ndarray无法有效发挥numpy优势，尽量避免使用

　　5) ndarray数组的创建方法：

　　　　a) 从python中的列表、元组等类型创建ndarray数组

　　　　　　x=numpy.array(list/tuple)

　　　　　　x=numpy.array(list/tuple, dtype=np.int64)

　　　　　　不指定dtype,numpy将根据数据情况关联一个dtype

　　　　b) 使用numpy中函数创建ndarray数组，如：arange,ones,zeros等

函数	说明
numpy.arange(n)	类似range()函数，返回ndarray类型，元素从0到n-1
numpy.ones(shape)	根据shape生成一个全一数组，shape是元组类型
numpy.zeros(shape)	根据shape生成一个全零数组，shape是元组类型
numpy.full(shape,val)	根据shape生成一个数组，每个元素值都是val
numpy.eye(n)	生成n阶单位阵
numpy.ones_like(a)	根据数组a的形状生成一个全1数组
numpy.zeros_like(a)	根据数组a的形状生成一个全0数组
numpy.full_like(a,val)	根据数组a的形状生成一个数组，每个元素值都是val
numpy.linspace()	根据起止数据等间距地填充数据，形成数组
numpy.concatenate()	将两个或多个数组合并成一个新的数组

　　　　c) 从字节流(raw bytes )中创建ndarray数组

　　　　d) 从文件中读取特定格式，创建ndarray数组

　　6）ndarray数组的变换

　　　　a) ndarray数组的维度变换(例如x=numpy.eye(n))

函数	说明
x.reshape(shape)	不改变数组元素，返回一个shape形状的数组，原数组不变
x.resize(shape)	与.reshape()功能一致，但修改原数组
x.swapaxes(ax1,ax2)	将数组n个维度中的两个维度进行调换
x.flatten()	对数组进行降维，返回折叠后的一维数组，原数组不变

　　　　b) ndarray数组的其他变换

函数	说明
x.astype(new_type)	类型变换：创建一个新数组(原始数据的一个拷贝）即使两个数据类型一致
x.tolist()	向列表变换

　　7）ndarray数组的操作：
数组的索引：获取数组中特定元素。例如

数组的切片：获取数组元素子集的过程。

a）一维数组的索引和切片：与python的列表类似

b）多维数组的索引：

　　　　每个维度的索引值用逗号分隔，选取一个维度用：(冒号)，每个维度切片方法与一维数组相同。

　　　　例如：

　　8）ndarray数组的运算：

　　　　数组与标量之间的运算：

数组与标量之间的运算作用于数组的每一个元素

　　 numpy的一元函数：

函数	说明
numpy.abs(x)/.fabs(x)	计算数组中各元素的绝对值
numpy.sqrt()	计算数组中各元素的平方根
numpy.square(x)	计算数组中各元素的平方
numpy.log(x)/.log10(x)/log2(x)	计算数组各元素自然对数、10底对数、2底对数
numpy.ceil(x)/.floor(x)	计算数组各元素的ceilling值或floor的值
numpy.rint(x)	计算数组各元素的四舍五入值
numpy.modf(x)	将数组各元素的小数和整数部分以两个独立数组形式返回
numpy.cos(x)/.cosh(x) numpy.sin(x)/.sinh(x) numpy.tan(x)/.tanh(x)	计算数组各元素的普通型和双曲型三角函数
numpy.sign(x)	计算数组各元素的符号值
numpy.exp(x)	计算数组各元素的指数值

　　　　numpy的二元函数：

函数	说明
+ - * / **	两数组各元素进行对应运算
numpy.maximum(x)/.fmax(x) numpy.minimum(x)/.fmin()	元素级的最值
numpy.mod(x,y)	元素级的模运算
numpy.copysign(x,y)	将数组y中各元素的符号赋值给数组x对应元素
> < >= == !=	算术比较运算符，产生布尔类型

二、numpy库数据存取与文件

　　1、数据的csv文件存取：

　　　　a) csv文件：Comma-Separated Value 逗号分隔值。CSV文件是一种常见的文件格式，用于存储批量数据

　　　　b) numpy库向文件写入csv格式并从csv文件读取数据。

　　　　　　i. 向文件写入csv的函数

　　　　　　　　　　numpy.savetxt(frame,array,fmt=’%.18e’, delimiter=None)：

　　　　　　　　　　功能：该函数可以生成带有特定分隔字符串的文件。

　　　　　　　　　　参数解释：

　　　　　　　　　　frame：文件、字符或生产器，可以是.gz或.bz2的压缩文件。（即文件路径）

　　　　　　　　　　array：要存入文件的数组。

　　　　　　　　　　fmt (format)：写入文件中每一个元素（整型,浮点型等保存在文件中所对应

　　　　　　　　　　　　　　　　字符串的格式）使用的格式。例如：%d，%2.f，%.18e。

　　　　　　　　　　　　　　　　默认%.18e(科学计数法保留18位小数)，这个参数常要修改。

　　　　delimiter：分隔字符串，默认是空格。其表示写入到数据文件中，数据之间

　　　　　　　　　　　　　　　的分隔字符串。CSV文件分隔串为 ‘,’ ，即delimiter=’,’ 。

　　　　　　ii. 读入csv格式文件的函数

　　 x=numpy.loadtxt(frame,dtype=numpy.float,delimiter=None,unpack=False)

　　参数解释：

　　 frame：文件、字符串或产生器，可以是.gz或.bz2的压缩文件。

　　 dtype：数据类型，可选，将csv文件每个元素字符串变成特定格式。

　　默认float类型。

　　 unpack：False表示读入的数据写入一个数组，True表示读入属性将分别写

　　　　　　　　　　　　入不用变量。

　　 delimiter：分割字符串，默认是任何空格。

　　　　c) CSV文件的局限性：CSV文件只能有效存储一维和二维数组，即上述函数只能有效存取和读取一维和二维数组。

　　2、任意维度数据的存取：

　　　　a) 对于ndarray数组a，可以使用a.tofile(frame, sep=’’ , format=‘%s’)

　　　　　　参数解释：

　　　　　　　 frame：文件或字符串的名字。

　　　　　　　 sep：数据分割字符串，如果是空串，写入文件为二进制（占用空间更少）。

　　　　　　　format：写入数据的格式。例如：%d 。

　　　　　　注意：文件将不会包含维度信息，而是将每个维度元素按列写入csv文件。

　　　　b) 从文件还原数据：

　　　　　　X=numpy.fromfile(frame,dtype=float,count=-1,sep=’’)

　　　　　　参数解释：

　　　　　　frame：文件、字符串的名字。

　　　　　　dtype：读取数据的类型。

　　　　　　count：读入元素个数，默认-1表示读入整个文件。

　　　　　　sep：表示数据分割字符串，如果是空串，写入文件为二进制。

　　　　　　注意：读入后的ndarray数组对象a，通过a.reshape()函数还原维度信息。只有预

　　　　　　　　先知道文件的维度以及元素类型才能有效还原数据。即a.tofile()与a.fromfile()

　　　　　　　　需要配合使用。

　　　　　　　　可以通过元数据文件来存储额外信息（比较繁琐）。

　　　　c) numpy的便捷文件存取:

　　　　　　 i. numpy.save(fname,array)或numpy.savez(fname,array) //存文件

　　　　　　　　参数解释：

　　　　　　　　frame：文件名，已.npy为拓展名，压缩拓展名为.npz。

　　　　　　　 array：要存储的数组变量。

　　　　　　ii. numpy.load(fname) //还原文件

　　　　　　　　参数解释：

　　　　　　　　　　frame：文件名，以.npy为拓展名，压缩拓展名为.pyz

三、numpy库的随机函数

　　numpy的random子库 ( 调用的时候直接numpy.functionName() )：

函数	说明
第一类
rand(d0,d1,…,dn)	根据d0-dn创建随机数数组，浮点数，[0,1),均匀分布
randn(d0,…,dn)	根据d0-dn创建随机数数组，标准正态分布
randint( low[ , high,shape] )	根据shape创建随机整数或整数数组，范围是[ low,high ]
seed(s)	随机数种子，s是给定的种子数
第二类
shuffle(a)	根据数组a的第1轴进行随机排列，改变原数组a
permutation(a)	根据数组a的第1轴产生一个新的乱序数组，不改变原数组a
choice(a[,size,replace,p] )	从一维数组a中以概率p抽取元素，形成size形状新数组，replace表示每次抽取是否可以重用元素，默认为False
第三类
uniform(low,high,size)	产生具有均匀分布的数组，low是启始值，high是结束值，size形状
normal(loc,scale,size)	产生具有正态分布的数组，loc是均值，scale是标准差，size是形状
poisson(lam,size)	产生具有泊松分布的数组，lam是随机事件发生概率，size是形状

四、numpy的统计函数

　　　统计函数：统计数组中的信息进行统计运算。

　　　numpy直接提供的统计类函数通过numpy.functionName()调用：

函数	说明
sum(a,axis=None)	根据给定轴axis计算数组a相关元素之和，axis整数或元组
mean(a,axis=None)	根据给定轴axis计算数组a相关元素的期望，axis为整数或元组
average(a,axis=None,weights=None)	根据给定轴axis计算数组a的加权平均值
std(a,axis=None)	根据给定轴axis计算数组a的标准差
var(a, axis=None)	根据给定轴axis计算数组a相关元素方差
min(a) max(a)	计算数组a中元素的最小值、最大值
argmin(a) argmax(a)	计算数组a中元素最小值、最大值的降一维后下标
unravel_index(index,shape)	根据shape将一堆下标index转换成多维下标
ptp(a)	计算数组a中元素最大值与最小值之差
median(a)	计算数组a中元素的中位数（中值）

五、梯度函数

　　梯度：连续值之间的变化率，即斜率。

　　　　numpy.random的梯度函数只有一个：
　　　　numpy.gradient( f )：计算数组中元素的梯度，当t为多维时，返回每个维度梯度