numpy学习笔记

# -*- coding: utf-8 -*-

"""

主要记录代码，相关说明采用注释形势，供日常总结、查阅使用，不定时更新。

Created on Mon Aug 20 23:37:26 2018

@author: Dev

"""

import numpy as np

from datetime import datetime

import random

对a,b两个列表的相同位的元素进行运算求和：

# 纯Python
def pythonSum(n):
    # 对列表循环计算
    a = [x for x in range(n)]
    b = [x for x in range(n)]
    c = []
    for i in range(len(a)):
        a[i] = i ** 2
        b[i] = i ** 3
        c.append(a[i] +b[i])
    return c

# numpy
def numpySum(n):
    # 直接对数组操作
    a = np.arange(n) ** 2
    b = np.arange(n) ** 3
    c = a + b
    return c

# 效率比较
size = 1000
# pythonSum()
start = datetime.now()  # 起始时间
c = pythonSum(size)
delta = datetime.now() - start  # pythonSum()的运行时间
print("The last two elements: ", c[-2:])    # 打印最后两个元素，确认准确性
print("PythonSum elapsed time in microseconds: ", delta.microseconds)   # 以微秒为单位显示运行时间

# pythonSum结果

The last two elements: [995007996, 998001000]
PythonSum elapsed time in microseconds: 999

# numpySum()
start = datetime.now()
c = numpySum(size)
delta = datetime.now() - start
print("The last two elements: ", c[-2:])
print("NumpySum elapsed time in microseconds: ", delta.microseconds)

# numpySum结果

The last two elements: [995007996 998001000]
NumpySum elapsed time in microseconds: 0

可以看出使用numpy数组的速度超快~

numpy数组

a = np.arange(5)

print(a.dtype)

多维数组

m = np.array([np.arange(2), np.arange(2)]) # 创建一个二维数组

print(m)

# 创建元素为0的数组

zeros = np.zeros(10)

zeros_2 = np.zeros((3, 6)) # 元素为0的3*6数组

# 创建元素随机(empty)的数组

empty = np.empty((2, 3, 2))

# 访问数组元素

a = np.array(([1, 2], [3, 4]))

print(a[0, 0])

print(a[0, 1])

print(a[1, 0])

print(a[1, 1])

数组元素的数据类型

print(np.float64(42)) # float浮点型

print(np.float(True))

print(np.float(False))

print(np.int8(42.0)) # int整型

print(np.bool(42)) # Boolean布尔型

print(np.bool(0))

print(np.bool(42.0))

# 创建数组时定义元素的数据类型

print(np.arange(7, dtype=np.uint16))

print(np.arange(9, dtype=np.float64))

数据类型转换

# 类型转换时出现的TypeError异常

try:

print(np.int(42.0 + 1.j))

except TypeError:

print("TypeError: can't convert complex to int!")

arr = np.array([1, 2, 3, 4, 5])

print(arr.dtype) # 元素类型

float_arr = arr.astype(np.float64)

print(float_arr.dtype)

arr = np.array([3.7, -1.2, -2.6, 0.5, 12.9, 10.1])

print(arr.dtype)

int_arr = arr.astype(np.int32) # 将float64类型转换为int32类型

# 将字符串数组转换为字符型

numeric_string = np.array(['1.25', '-9.6', '42'], dtype=np.string_)

print(numeric_string.astype(float)) # 再转换为float类型

字符编码

print(np.arange(7, dtype='f')) # float32

print(np.arange(7, dtype='d')) # float64

print(np.arange(7, dtype='D')) # complex128

print(np.dtype(float))

print(np.dtype('f'))

print(np.dtype('d'))

print(np.dtype('F'))

print(np.dtype('D'))

print(np.dtype('f8'))

print(np.dtype('float64'))

# dtype类的属性

t = np.dtype('float64')

print(t.char) # 字符编码

print(t.type) # t的类型

print(t.str)

自定义数据类型

# [(字段1, 类型, 长度), (字段2, 类型, 长度), ...]

t = np.dtype([('name', np.str_, 40), ('numitems', np.int32), ('price', np.float32)])

print(t)

print(t.name)

itemz = np.array([('Meaning of life DVD', 42, 100), ('Butter', 13, 2.72)]) # 按照格式生成数组

数组与标量的计算

arr = np.array([[1, 2, 3], [4, 5, 6]])

print(arr * arr) # 对应位的元素相乘

print(arr - arr) # 对应位的元素相减

print(1 / arr) # 取倒数

print((arr ** 2) ** 0.5) # 平方后开根号

一维数组的索引与切片(与列表切片用法相似)

a = np.arange(9)

print(a[3: 7])

print(a[:7:2]) # 从0到6，步长为2

s = slice(3, 7, 2) # 先设定切片位置及步长，再调用

print(a[s])

print(a[::-1]) # 倒序排列1

s = slice(None, None, -1) # 倒序排列2

print(a[s])

多维数组的切片与索引

b = np.arange(24).reshape(2, 3, 4)

print(b.shape) # 数组b的维数

# 使用索引与切片选取指定元素

print(b[0,0,0])

print(b[:,0,0])

print(b[0]) # 第一维的所有元素

print(b[0, :, :]) # 第一维的所有元素

print(b[0, ...]) # 第一维的所有元素

print(b[0,1]) # 第一维第二行

print(b[0,1,::2]) # 以2为步长

print(b[...,1]) # 两个维的第一列

print(b[:,1]) # 两个维的第一行

print(b[0,:,1]) # 第一维第一列

print(b[0,:,-1]) # 第一维最后一列

print(b[0,::-1, -1]) # 第一维最后一列的倒序排列

print(b[0,::2,-1]) # 第一维的第0行和第2行的最后一个元素

print(b[::-1]) # 两个维倒序

s = slice(None, None, -1) # 所有元素倒序排列

print(b[(s, s, s)])

布尔型索引（mask）

names = np.array(['Bob', 'Joe', 'Will', 'Bob', 'Will', 'Joe', 'Joe'])

random.seed(200) # 设置随机种子

data = np.random.random((7, 4))

print(names == 'Bob') # 生成布尔型mask

print(data[names == 'Bob']) # 根据mask的值匹配data数组中的元素

print(data[names == 'Bob', 2:]) # 匹配值从第三列到最后一列的元素

print(data[names == 'Bob', 3]) # 匹配值第四列的元素

names != 'Bob'

data[~(names == 'Bob')]

mask = (names == 'Bob') | (names == 'will') # 或运算符

data[mask]

data[data < 0] = 0

data[names != 'Joe'] = 7

花式索引（索引乱序）

arr = np.empty((8, 4))

for i in range(8):

arr[i] = i

arr[[4, 3, 0, 6]] # 根据索引的顺序取值

arr[[-3, -5, -7]]

arr = np.arange(32).reshape((8, 4))

arr[[1, 5, 7, 2], [0, 3, 1, 2]]

arr[[1, 5, 7, 2]][:, [0, 3, 1, 2]]

arr[np.ix_([1, 5, 7, 2], [0, 3, 1, 2])]

数组转置

arr = np.arange(15).reshape((3, 5))

arr.reshape((5,3))

print(arr.T)

改变数据维度

b = np.arange(24).reshape((2, 3, 4))

print(b)

print(b.ravel()) # 将多维数组将为一维

print(b.flatten())

b.shape = (6, 4)

print(b)

print(b.transpose())

b.resize((2, 12))

print(b)

注： flatten()与ravel()的区别

# 当修改ravel()返回的值时，会影响原数组；而flatten则不会

arr_a = np.arange(4).reshape(2, 2)

arr_a.ravel()[-1] = 5

print(arr_a) # arr_a的最后一个元素已被修改

arr_a.flatten()[0] = 10

print(arr_a) # 不会影响原数组的第一个元素

组合数组

a = np.arange(9).reshape(3, 3)

print(a)

b = 2 * a

print(b)

# 水平组合

print(np.hstack((a, b)))

print(np.concatenate((a, b), axis=1))

# 竖直组合

print(np.vstack((a, b)))

print(np.concatenate((a, b), axis=0))

# 深度组合deep

print(np.dstack((a, b)))

# column_stack & row_stack(与hstack & vstack效果类似)

oned = np.arange(2)

print(oned)

twice_oned = 2 * oned

print(twice_oned)

print(np.column_stack((oned, twice_oned)))

print(np.column_stack((a, b)) == np.hstack((a, b)))

print(np.row_stack((oned, twice_oned)))

print(np.row_stack((a, b)))

print(np.row_stack((a, b)) == np.vstack((a, b)))

数组的分割

a = np.arange(9).reshape(3, 3)

print(a)

# 从水平方向分成三列（跨列）

print(np.hsplit(a, 3))

print(np.split(a, 3, axis=1))

# 从竖直方向分成三行（跨行）

print(np.vsplit(a, 3))

print(np.split(a, 3, axis=0))

# 深度分割

c = np.arange(27).reshape(3, 3, 3)

print(c)

print(np.dsplit(c, 3))

数组的属性

b = np.arange(24).reshape(2, 12)

b.ndim # 维度

b.size # 元素个数

b.itemsize # 单个元素的大小

b.nbytes # 整个数组的大小（itemsize * size）

# 复数

b = np.array([1.+1.j, 3.+2.j])

b.real # 实部

b.imag # 虚部

数组的转换

b = np.arange(4).reshape(2, 2)

b.flat # 将数组转换为一维数组

for i in range(len(b.flat)): # 循环访问数组元素

print(b.flat[i])

b = np.array([1.+1.j, 3.+2.j])

print(b)

print(b.tolist()) # 转换为list

print(b.tostring()) # 转换为字符

# 使用np.fromstring将字符串转换为指定格式

print(np.fromstring(b'x00x00x00x00x00x00xf0?x00x00x00x00x00x00xf0?x00x00x00x00x00x00x08@x00x00x00x00x00x00x00@', dtype=complex))