Caffe学习记录(十) SegNet等分割网络学习

图像分割作为计算机视觉的一个方向，广泛应用在各个领域，记录一下学习的过程，以及各个网络的优缺点，不同的地方等。

最流行的方法是FCN，整个分割的流程大致可以看做如下：

FCN顾名思义，全卷机网络，就是把fc层都换做1x1的卷积层，channel等价于fc层的输出个数。

FCN的架构为编码器，和解码器组成，编码器阶段为卷积+池化的下采样过程，解码器阶段为卷积+upsampling的过程，最后接上一个1x1的filter进行pixel分类，如下图

上采样的原因：池化层会丢失图像信息和降低图像分辨率且是不可逆的操作，对图像分割任务有一些影响。上采样可以补足一些图片的信息，但是信息补充的肯定不完全，所以还需要与左边的分辨率比较高的图片相连接起来（直接复制过来再裁剪到与上采样图片一样大小），这就相当于在高分辨率和更抽象特征当中做一个折衷，因为随着卷积次数增多，提取的特征也更加有效，更加抽象。—— jianyuchen23 from zhihu

SegNet的全称是“用于图像分割的深度卷积编码器-解码器架构”

segnet的上采样是做反向 max pooling，在做下采样的时候，segnet会记录max pooling的index的位置，剩下的部分用0来填充：