Deep Neural Networks are Easily Fooled: High Confidence Predictions for Unrecognizable Images

Deep Neural Networks are Easily Fooled: High Confidence Predictions for Unrecognizable Images

2020-02-24 15:32:02

Paper: https://arxiv.org/pdf/1412.1897.pdf

Project Page: http://www.evolvingai.org/fooling

Code: https://github.com/Evolving-AI-Lab/fooling

1. Background and Motivation:

深度神经网络学习层级的表示从而可以进行模式识别。最近，这些网络结构呈现出了很强的效果，特别是在视觉分类任务中。给定接近人类水平的 DNNs 来分类视觉物体，会抛出一个关于计算机和人类视觉的差异性的问题。一个最近的研究表明，DNN 和人类视觉之间有非常大的差异性。对输入图像做稍微的改动，就可以使得 DNN 错误的将其分类为其他物体；但是人眼看起来却几乎无差别。在本文中，作者提供了另外一个思路来说明 DNN 和 human vision 之间的不同：It is easy to produce images that are completely unrecognizable to humans, but that state-of-the-art DNNs believe to be recognizable objects with over 99% confidence。

具体来说，作者利用进化算法或者梯度上升方法来产生高置信度的图像。这些 DNN 模型表明在 ImageNet 和 MNIST 数据集上都有较好的效果。作者也发现，对于 MNIST DNNs，it is not easy to prevent the DNNs from being fooled by retraining them with fooling images labeled as such。

2. Generating images with evolution:

作者测试的图像是由进化算法（Evolutionary algorithms，EAs）得到的。EAs 是由达尔文进化论启发得到的。他们保持一个微生物种群（a population of "organisms"），即此处的 image，迭代的进行 face selection，然后随机的修改。哪些微生物被选择，主要取决于 fitness function，在这些实验中是 DNN 对图像预测的最高预测值。传统的 EAs 优化解决方案可以在一个目标上执行的很好，或者一小撮的目标。我们利用一种新的算法，称为 muliti-dimentional achieve of phenotypic elites MAP-Elites, 这可以确保我们同时进化一个种群，这些样本可以在很多类别都得到很好地分数。MAP-Elites works by keeping the best individual found so far for each objective。在每一次迭代中，其从种群中选择一个随机的 organism，任何个体因为有较高的 fitness score，就会用于替代当前的 champion。此处，fitness is determined by showing the image to the DNN; 如果图像产生了一个较高的预测得分，新产生的个体，将会变成 champion。

我们用了两种 encodings 来测试 EAs，即图像是如何表达为基因的（how an image is represented as a genome）。

第一种是 direct encoding，对于 MNIST 来说，每一个 28*28 分辨率都会有一个灰度值；对于 ImageNet 来说，256*256 分辨率的，会有（H,S,V）三个值。每一个像素值都被初始化为服从 [0, 255] 范围的正态随机噪声。这些值是独立变化的；首先决定哪些值需要变换，通过一个从 0.1 开始的比值，每 1000 次产生将对该值进行减半处理。被选中变化的值，可以通过 polynomial mutation operator 来修改，规定的变化长度为 15。第二个 EA 是 indirect encoding，更可能产生 regular 的图像。具体来说，此处的 indirect encoding 是 compositional pattern-producing network (CPPN)。

重要的是，用 CPPNs 进化的图像可以被 DNNs 正确的识别，如图 3 所示，这也说明：a CPNN-encoded EA can produce images that both humans and DNN can recognize. 这些图像是从 PicBreeder.org 上产生的，用户作为进化算法的 fitness function来选择他们喜欢的图像。

CPPNs 和人工神经网络相似。一个 CPPN 将（x, y）位置的像素值作为输入，输出 MNIST 的灰度值或者 ImageNet 的 HSV color values。像神经网络一样，CPPN 计算的函数依赖于 CPPN 神经元个数，如何连接，神经元之间的权重。每一个 CPPN node 可以是激活函数中的一个，如 sine, sigmoid, Gaussian and linear。例如，将 x 输入到高斯函数中，将会提供 left-right symmetry，将 y 输入到一个 sine function 来提供 top-bottom repetition。进化决定了 CPPN network 的拓扑，权重和激活函数。CPPN network 开始的时候，是没有 hidden nodes，随着时间的推进，慢慢的添加 nodes，鼓励进化首先搜索简单，常规的 images。本文的实验室在 Sferes 进化计算框架的基础上进行。