李宏毅机器学习课程笔记-7.3CNN应用案例

Deep Dream
Deep Style
围棋
语音
文本
图片生成

Deep Dream

Deep Dream是这样的：如果给机器一张图片(x)，Deep Dream会把机器看到的内容加到图片(x)中得到(x')。那如何实现呢？

如上图所示，将图片(x)输入到CNN中，然后取出CNN中某一层(L)（可以是卷积、池化阶段的隐藏层，也可以是FNN中的隐藏层）的输出(O)，然后将(L)中的正值调大、负值调小得到一个新的输出(O')，然后通过梯度下降找到一张新的图片(x')使层(L)的输出为(O')，这个(x')就是我们要的结果。直观理解的话，也就是让CNN夸大它所看到的内容。

然后就得到了如下结果……（看到的时候我惊了，真是十分哇塞）

Deep Style

Deep Style是这样的：如果给机器一张图片(x)和(y)，Deep Style可以把图片(y)的风格加到图片(x)上，也就是风格迁移。

那如何实现呢？论文：A Neural Algorithm of Artistic Style。

把图片(x)传入CNN并得到输出，然后其输出作为图片(x)的内容(c_x)（content）；
把图片(y)传入CNN并得到输出，但不是考虑输出的值是什么，而是考虑输出层中各个filter输出之间的相关性（corelation）作为图片(y)的风格(s_y)（style）；
最后基于同一个CNN找到图片(z)，图片(z)传入CNN后得到的内容(c_z)像(c_x)、风格(s_z)像(s_y)。