python numpy 大矩阵运算容易内存爆炸

在一些情况下，程序运行产生如下结果，然后进程自动终止，导致这一结果的原因很有可能是内存爆炸。

当两个较大的 (e.g., 10000*10000 维）ndarray 做运算(加法，or 乘法）时，很容易出现这样的结果.

linux 系统下，使用 top 命令，可以很容易地看到内存（%MEM) 的使用情况：

解决办法：

大多数情况下，这种大矩阵都是稀疏的。尽可能地利用稀疏计算的方式，例如稀疏矩阵，或者只计算非 0 位置的值。
如果都是整数运算，可以设置 dtype=int，而非 dtype=float, 可以省下不少空间。

例如：如下代码段2 可以完成代码段1 的功能，且避免了大量内存的开销，同时加快了运行速度。

# 代码段 1，true_similarity_matrix 是 int, similarity_matrix 是 float
tmp_matrix = similarity_matrix * true_similarity_matrix   # 内存会炸掉，两个 10000*10000 维 float array
num_correct_edge = sum(sum(tmp_matrix))

# 代码段 2
for i in range():
    for j in range():
        set_true_ij.append(i,j)
num_correct_edge = 0
for i, j in set_true_ij:
    num_correct_edge += similarity_matrix[i,j]