NumPy基础:通用函数-快速的元素级数组函数

通用函数

  • 一元ufunc
    • abs、fabs:计算整数、浮点数或复数的绝对值。对于非复数值,可以使用更快的fabs
    • sqrt:计算各元素的平方根。相当于arr**0.5
    • square:计算各元素的平方。相当于arr**2
    • exp:计算各元素的指数
    • log、log10、log2、log1p:分别对自然对数(底数为e)、底数为10,2的log,log(1+x)
    • sign:计算各元素的正负号,1(正数)、0(零)、-1(复数)
    • ceil:计算各元素的ceiling值,即向上取整
    • floor:计算各元素的floor值,即向下取整
    • rint:将各元素四舍五入到最接近的整数
    • modf:将数组的小数和整数部分以两个独立数组返回
    • isnan:返回一个表示“哪个值是NaN”的布尔型数组
    • isfinte、isinf:分别返回一个表示“哪个元素是有穷的(非inf,非NaN)”或“哪些元素是无穷的”的布尔型数组
    • cos、cosh、sin、sinh、tan、tanh:普通型和双曲型三角函数
    • arccos、arccosh、arcsin、arcsinh、arctan、arctanh:反三角函数
    • logical_not:计算个元素not x 的真值。相当于-arr
  • 二元ufunc
    • add:将数组中对应的元素想加
    • subtract:从第一个数组中减去第二个数组中的元素
    • multiply:数组元素相乘
    • divide、floor_divide:除法或下圆整除法(丢弃余数)
    • power:对于第一个数组中的元素A,根据第二个数组中的元素B,计算A的B次方
    • maximum、fmax:元素级最大值计算。fmax忽略NaN
    • minimum、fmin:元素级最小值计算。fmin忽略NaN
    • mod:元素级求模计算(除法的余数)
    • copysign:将第二个数组中的值的符号复制给第一个数组中的值
    • greater、greater_equal、less、less_equal、equal、not_equal:元素级比较运算,最终产生布尔型数组。相当于>、>=、<、<=、==、!=
    • logical_and、logical_or、logical_xor:元素级的真值逻辑运算。相当于运算符&、|、^
import numpy as np

# abs、fabs:计算整数、浮点数或复数的绝对值。对于非复数值,可以使用更快的fabs
arr_abs = np.array([1,2,-3,4,-5.98])
print(np.abs(arr_abs)) # [1.   2.   3.   4.   5.98]
print(np.fabs(arr_abs)) # [1.   2.   3.   4.   5.98]

# sqrt:计算各元素的平方根。相当于arr**0.5
arr_sqrt = np.array([1,4,9,16,25])
print(np.sqrt(arr_sqrt)) # [1. 2. 3. 4. 5.]

# square:计算各元素的平方。相当于arr**2
arr_square = np.array([1,2,3,4,5])
print(np.square(arr_square)) # [ 1  4  9 16 25]

# sign:计算各元素的正负号,1(正数)、0(零)、-1(复数)
arr_sign = np.array([-2,-1,0,1,2])
print(np.sign(arr_sign)) # [-1 -1  0  1  1]

# ceil:计算各元素的ceiling值,即向上取整
arr_ceil = np.array([1.2,2.5,3.6,4.1,5.9])
print(np.ceil(arr_ceil)) # [2. 3. 4. 5. 6.]

# floor:计算各元素的floor值,即向下取整
arr_floor = np.array([1.2,2.5,3.6,4.1,5.9])
print(np.floor(arr_floor)) # [1. 2. 3. 4. 5.]

# rint:将各元素四舍五入到最接近的整数
arr_rint = np.array([1.2,2.5,2.51,3.6,4.1,5.9])
print(np.rint(arr_rint)) # [1. 2. 3. 4. 4. 6.]

# modf:将数组的小数和整数部分以两个独立数组返回
arr_modf = np.array([1.2,2.5,2.51])
print(np.modf(arr_modf)) # (array([0.2 , 0.5 , 0.51]), array([1., 2., 2.]))

# isnan:返回一个表示“哪个值是NaN”的布尔型数组
arr_isnan = np.array([1,2,3,4,5])
print(np.isnan(arr_isnan)) # [False False False False False]

利用数组进行数据处理

import numpy as np
import matplotlib.pyplot as plt


# 用数组表达式代替循环的做法,通常被称为矢量化
points = np.arange(-5,5,0.01) # 1000个间隔相等的点
xs,ys = np.meshgrid(points,points)

z = np.sqrt(xs**2+ys**2)
plt.imshow(z)
plt.colorbar()
plt.title("Image plot of $sqrt{x^2+y^2}$ for a grid of values")
plt.show()

 

将条件逻辑表述为数组运算

import numpy as np

# numpy.where函数是 x if condition else y的矢量化版本。
from numpy.matlib import randn

xarr = np.array([1.1,1.2,1.3,1.4,1.5])
yarr = np.array([2.1,2.2,2.3,2.4,2.5])
cond = np.array([True,False,True,True,False])

# 当cond为True时,选择xarr,否则选择yarr
result = []
for x,y,c in zip(xarr,yarr,cond):
    if c:
        result.append(x)
    else:
        result.append(y)
print(result) # [1.1, 2.2, 1.3, 1.4, 2.5]

result = [(x if c else y) for x,y,c in zip(xarr,yarr,cond)]
print(result) # [1.1, 2.2, 1.3, 1.4, 2.5]

# 换成np.where写法
result = np.where(cond,xarr,yarr)
print(result) # [1.1 2.2 1.3 1.4 2.5]

# 生成一个随机数组
arr = randn(4,4)
print(arr)
'''
[[-1.16508783  0.18874028  1.0206809   0.76529663]
 [ 1.54512481 -1.36804933 -1.80001501 -0.88638478]
 [-2.1297874   0.28795926 -1.30068181  1.8016327 ]
 [-1.34510486  0.60960465 -0.42626585 -0.6275682 ]]
'''
# 将正值替换为2,负值替换为-2
print(np.where(arr>0,2,-2))
'''
[[-2  2  2  2]
 [ 2 -2 -2 -2]
 [-2  2 -2  2]
 [-2  2 -2 -2]]
'''
# 将正值替换为2,负值不变
print(np.where(arr>0,2,arr))
'''
[[-1.16508783  2.          2.          2.        ]
 [ 2.         -1.36804933 -1.80001501 -0.88638478]
 [-2.1297874   2.         -1.30068181  2.        ]
 [-1.34510486  2.         -0.42626585 -0.6275682 ]]
'''

# 接下来有点费脑子
'''
result = []
for i in range[n]:
    if cond1[i] and cond2[]:
        result.append(0)
    elif cond1[i]:
        result.append(1)
    elif cond2[2]:
        result.append(2)
    else:
        result.append(3)

# 可以改写成一个嵌套where
np.where(cond1 & cond2,0,
         np.where(cond1,1,
                  np.where(cond2,2,3)))
'''

数学和统计方法

  • 基本数组统计方法
    • sum:对数组中全部或某轴向的元素求和。零长度的数组sum为0
    • mean:算术平均数。零长度的数组mean为NaN
    • std、var:标准差和方差,自由度可调(默认为n)
    • min、max:最大值和最小值
    • argmin、argmax:最小和最大元素的索引
    • cumsum:所有元素的累计和
    • cumpord:所有元素的累计积
import numpy as np

arr = np.array([[1,2,3,4],[4,5,6,7],[7,8,9,10]])
print(arr)
'''
[[ 1  2  3  4]
 [ 4  5  6  7]
 [ 7  8  9 10]]
'''
print(arr.mean()) # 5.5
print(np.mean(arr)) # 5.5
print(arr.mean(axis=1)) # [2.5 5.5 8.5], 2.5=(1+2+3+4)/4
print(arr.sum()) # 66
print(arr.sum(0)) #[12 15 18 21]

用于布尔数组的方法

import numpy as np
from numpy.matlib import randn

arr = randn(100)
print((arr>0).sum()) #正数的个数


bools = np.array([False,True,True,False,False])
# any检查是否存在一个或者多个True
print(bools.any()) # True
# all检查是否都是True
print(bools.all()) # False 

排序

import numpy as np

arr = np.array([4,3,6,1,2,9])
arr.sort()
print(arr) # [1 2 3 4 6 9]

arr_2d = np.array([[4,3,6,1,2,9],[4,7,4,5,6,7],[10,4,2,5,3,9]])
arr_2d.sort()
print(arr_2d)
'''
[[ 1  2  3  4  6  9]
 [ 4  4  5  6  7  7]
 [ 2  3  4  5  9 10]]

'''
# 多维数组可以在任何一个轴向上进行排序,只需要将编号传给sort即可
arr_2d2 = np.array([[5,4,3,2,1],[4,3,2,1,0],[9,8,7,6,5],[1,1,1,5,2]])
arr_2d2.sort(0)
print(arr_2d2)
'''
[[1 1 1 1 0]
 [4 3 2 2 1]
 [5 4 3 5 2]
 [9 8 7 6 5]]
'''

唯一化以及其他的集合逻辑

  •  数组的集合运算
    • unique(x):计算x中的唯一元素
    • intersect1d(x,y):计算x和y中的公共元素
    • union1d(x,y):计算x和y的并集
    • in1d(x,y):得到一个表示“x元素是否包含于y”的布尔型数组
    • setdiff1d(x,y):集合的差,x元素不在y中
    • setxor1d(x,y):集合的对称差,即存在于一个数组中但是不同时存在于两个数组中的元素
import numpy as np

names = np.array(['Bob','Joe','Will','Bob','Will','Joe','Joe'])
print(sorted(set(names))) # 去重 ['Bob' 'Joe' 'Will']
print(np.unique(names)) # 去重 ['Bob' 'Joe' 'Will']

arr1 = np.array([1,2,3])
arr2 = np.array([2,3,4])
# unique(x):计算x中的唯一元素
print(np.union1d(arr1,arr2)) # [1 2 3 4]
# intersect1d(x,y):计算x和y中的公共元素
print(np.intersect1d(arr1,arr2)) # [2 3]
# in1d(x,y):得到一个表示“x元素是否包含于y”的布尔型数组
print(np.in1d(arr1,arr2)) # [False  True  True]
# setdiff1d(x,y):集合的差,x元素不在y中
print(np.setdiff1d(arr1,arr2)) # [1]
# setxor1d(x,y):集合的对称差,即存在于一个数组中但是不同时存在于两个数组中的元素
print(np.setxor1d(arr1,arr2)) # [1 4]
原文地址:https://www.cnblogs.com/nicole-zhang/p/12931171.html