8、numpy——数组的迭代

1、单数组的迭代

NumPy 迭代器对象 numpy.nditer 提供了一种灵活访问一个或者多个数组元素的方式。

迭代器最基本的任务的可以完成对数组元素的访问。

1.1 默认迭代顺序

1 import numpy as np
2 a = np.arange(6).reshape(2, 3)
3 b = a.T  # b为a的装置
4 print('a=', a)
5 for i in np.nditer(a):
6     print(i)
7 print('b=', b)
8 for i in np.nditer(b):
9     print(i)

执行结果：

a= [[0 1 2]
 [3 4 5]]
0
1
2
3
4
5
b= [[0 3]
 [1 4]
 [2 5]]
0
1
2
3
4
5

注意：通过该种方式迭代输出的是以元素在存储器中的布局顺序输出的，无论其视图做何种改变（转置，变换shape），其输出结果是一致的，该中方式可以提高迭代效率

a 和 a.T 的遍历顺序是一样的，也就是他们在内存中的存储顺序也是一样的，但是 a.T.copy(order = 'C') 的遍历结果是不同的，那是因为它和前两种的存储方式是不一样的，默认是按行访问。

1.2 控制迭代的顺序

for x in np.nditer(a, order='F'):Fortran order，即是列序优先；
for x in np.nditer(a.T, order='C'):C order，即是行序优先；

 1 import numpy as np
 2  
 3 a = np.arange(0,60,5) 
 4 a = a.reshape(3,4)  
 5 print ('原始数组是：') 
 6 print (a) 
 7 print ('
') 
 8 print ('原始数组的转置是：') 
 9 b = a.T 
10 print (b) 
11 print ('
') 
12 print ('以 C 风格顺序排序：') 
13 c = b.copy(order='C')  
14 print (c)
15 for x in np.nditer(c):  
16     print (x, end=", " )
17 print  ('
') 
18 print  ('以 F 风格顺序排序：')
19 c = b.copy(order='F')  
20 print (c)
21 for x in np.nditer(c):  
22     print (x, end=", " )

执行结果：

原始数组是：
[[ 0  5 10 15]
 [20 25 30 35]
 [40 45 50 55]]


原始数组的转置是：
[[ 0 20 40]
 [ 5 25 45]
 [10 30 50]
 [15 35 55]]


以 C 风格顺序排序：
[[ 0 20 40]
 [ 5 25 45]
 [10 30 50]
 [15 35 55]]
0, 20, 40, 5, 25, 45, 10, 30, 50, 15, 35, 55, 

以 F 风格顺序排序：
[[ 0 20 40]
 [ 5 25 45]
 [10 30 50]
 [15 35 55]]
0, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55,

可以通过显式设置，来强制 nditer 对象使用某种顺序：

 1 import numpy as np 
 2  
 3 a = np.arange(0,60,5) 
 4 a = a.reshape(3,4)  
 5 print ('原始数组是：')
 6 print (a)
 7 print ('
')
 8 print ('以 C 风格顺序排序：')
 9 for x in np.nditer(a, order =  'C'):  
10     print (x, end=", " )
11 print ('
')
12 print ('以 F 风格顺序排序：')
13 for x in np.nditer(a, order =  'F'):  
14     print (x, end=", " )

执行结果：

 1 原始数组是：
 2 [[ 0  5 10 15]
 3  [20 25 30 35]
 4  [40 45 50 55]]
 5 
 6 
 7 以 C 风格顺序排序：
 8 0, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 
 9 
10 以 F 风格顺序排序：
11 0, 20, 40, 5, 25, 45, 10, 30, 50, 15, 35, 5

1.3 修改数组中的元素

nditer 对象有另一个可选参数 op_flags。默认情况下，nditer 将视待迭代遍历的数组为只读对象（read-only），为了在遍历数组的同时，实现对数组元素值得修改，必须指定 read-write 或者 write-only 的模式。

 1 import numpy as np
 2  
 3 a = np.arange(0,60,5) 
 4 a = a.reshape(3,4)  
 5 print ('原始数组是：')
 6 print (a)
 7 print ('
')
 8 for x in np.nditer(a, op_flags=['readwrite']): 
 9     x[...]=2*x 
10 print ('修改后的数组是：')
11 print (a)

执行结果：

原始数组是：
[[ 0  5 10 15]
 [20 25 30 35]
 [40 45 50 55]]


修改后的数组是：
[[  0  10  20  30]
 [ 40  50  60  70]
 [ 80  90 100 110]]

2、数组迭代(Iterating over arrays)

该部分内容位于numpy-ref-1.14.5中的3.15.4 Iterating over arrays 章节

numpy.nditer 为高效多维迭代器对象，用于对数组的迭代。

flags：sequence of str ，optional

用于控制迭代器行为的标志（flags）

buffrered - 再需要时可以缓冲

c_index - 跟踪C顺序的索引

f_index - 跟踪F顺序的索引

multi_index - 跟踪多指标，或每个迭代维度的一组指数

external_loop - 外部循环，将一维的最内层的循环转移到外部循环迭代器，使得numpy的矢量操作在处理更大规模数据时变得更有效率。

op_flags：list of list of str , optional

这是每个操作数的标志列表。至少必须指定一个“只读”、“读写”或“写”。

readonly - 该操作数表明可以读取

readwrite - 该操作数表明可以读取和写入

writeonly - 该操作数表明仅写入

no_broadcast - 该操作数可以防止被广播

copy - 该操作数表明允许临时只读拷贝

op_dtypes：dtype or tuple of dtype(s), optional

操作数所需的数据类型（s）。

order：{‘C’, ‘F’, ‘A’, ‘K’}, optional

控制迭代顺序（Controls the iteration order）

2.1 使用外部循环 external_loop

将一维的最内层的循环转移到外部循环迭代器，使得numpy的矢量化操作在处理更大规模数据时变得更有效率。

 1 a = np.arange(6).reshape(2,3)
 2 print(a)
 3 # [[0 1 2]
 4 #  [3 4 5]]
 5 for x in np.nditer(a, flags = ['external_loop']):
 6     print(x)
 7 # [0 1 2 3 4 5]
 8 
 9 for x in np.nditer(a, flags = ['external_loop'],order = 'C'):
10     print(x)
11 # [0 1 2 3 4 5]
12 
13 for x in np.nditer(a, flags = ['external_loop'],order = 'F'):
14     print(x)
15 # [0 3]
16 # [1 4]
17 # [2 5]

2.2 追踪单个索引或多重索引

 1 a = np.arange(6).reshape(2,3)
 2 print(a)
 3 # [[0 1 2]
 4 #  [3 4 5]]
 5 it = np.nditer(a,flags = ['f_index'])
 6 
 7 while not it.finished:
 8     print("%d <%d>" % (it[0], it.index))
 9     it.iternext()
10 
11 # 0 <0>
12 # 1 <2>
13 # 2 <4>
14 # 3 <1>
15 # 4 <3>
16 # 5 <5>

为了更清楚地表述，可以直观地看下表

flags = multi_index

 1 a = np.arange(6).reshape(2,3)
 2 print(a)
 3 # [[0 1 2]
 4 #  [3 4 5]]
 5 it = np.nditer(a,flags = ['multi_index'])
 6 
 7 while not it.finished:
 8     print("%d <%s>" % (it[0], it.multi_index))
 9     it.iternext()
10 # 0 <(0, 0)>
11 # 1 <(0, 1)>
12 # 2 <(0, 2)>
13 # 3 <(1, 0)>
14 # 4 <(1, 1)>
15 # 5 <(1, 2)>

multi_index是将元素的行列位置以元组方式打印出来，但元组形式不是整型，所以要将 %d 变为 %s，

若不改，则会报错 TypeError: %d format: a number is required, not tuple

 1 import numpy as np
 2 a = np.arange(6).reshape(1,2,3)
 3 print(a)
 4 # [[[0 1 2]
 5 #   [3 4 5]]]
 6 it = np.nditer(a,flags = ['multi_index'])
 7 
 8 while not it.finished:
 9     print("%d <%s>" % (it[0], it.multi_index))
10     it.iternext()
11 # 0 <(0, 0, 0)>
12 # 1 <(0, 0, 1)>
13 # 2 <(0, 0, 2)>
14 # 3 <(0, 1, 0)>
15 # 4 <(0, 1, 1)>
16 # 5 <(0, 1, 2)>

2.3 广播迭代

如果两个数组是可广播的，nditer组合对象能够同时迭代它们，假设数组 a 具有维度 3*4 ，并且存在维度为 1*4的另一个数组b，则使用以下类型的迭代器（数组b被广播到a的大小）

 1 import numpy as np 
 2  
 3 a = np.arange(0,60,5) 
 4 a = a.reshape(3,4)  
 5 print  ('第一个数组为：')
 6 print (a)
 7 print  ('
')
 8 print ('第二个数组为：')
 9 b = np.array([1,  2,  3,  4], dtype =  int)  
10 print (b)
11 print ('
')
12 print ('修改后的数组为：')
13 for x,y in np.nditer([a,b]):  
14     print ("%d:%d"  %  (x,y), end=", " )

执行结果：

 1 第一个数组为：
 2 [[ 0  5 10 15]
 3  [20 25 30 35]
 4  [40 45 50 55]]
 5 
 6 
 7 第二个数组为：
 8 [1 2 3 4]
 9 
10 
11 修改后的数组为：
12 0:1, 5:2, 10:3, 15:4, 20:1, 25:2, 30:3, 35:4, 40:1, 45:2, 50:3, 55:4,