计算机视觉（五）

卷积神经网络与迁移学习

卷积神经网络快速回顾
　　1.层级结构 2.数据处理 3.训练算法 4.优缺点
■ 典型CNN
　　1.AlexNet 2.GoogLeNet 3.VGG Net 4.ResNet
■ 物体定位
　　1.回归的思路
■ 物体检测
　　1.早期做法 2.RCNN/Fast-RCNN/Faster_RCNN 3.R-FCN
■ 文艺绘画与Neural Style
　　1.风格描述 2.主体对调与损失最小化

主要是以下层次：

　　□ 数据输入层/ Input layer
　　□ 卷积计算层/ CONV layer
　　□ ReLU激励层 / ReLU layer
　　□ 池化层 / Pooling layer
　　□ 全连接层 / FC layer
　　□ Batch Normalization层(可能有)

　　数据集输入层：

　　有3种常见的图像数据处理方式
　　□ 去均值
　　　　■ 把输入数据各个维度都中心化到0
　　□ 归一化
　　　　■ 幅度归一化到同样的范围
　　□ PCA/白化
　　　　■ 用PCA降维
　　　　■ 白化是对数据每个特征轴上的幅度归一化

　　卷积计算层：

　　　　参数共享机制

　　　　假设每个神经元连接数据窗的权重是固定的

　　　　固定每个神经元连接权重，可以看做模板

　　　　　　每个神经元值关注一个特性

　　　　需要估算的权重个数减小： AlexNet 1亿=>3.5W

　　　　一组固定的权重和不同窗口内数据做内积：卷积

　　　激励层(ReLU)
　　　　■ 把卷积层输出结果做非线性映射
　　　　　　□ Sigmoid
　　　　　　□ Tanh(双曲正切)
　　　　　　□ ReLU
　　　　　　□ Leaky ReLU
　　　　　　□ ELU
　　　　　　□ Maxout

　　□ 全连接层 / FC layer
　　　　■ 两层之间所有神经元都有权重连接
　　　　■ 通常全连接层在卷积神经网络尾部
　　□ 一般CNN结构依次为
　　　　■ INPUT
　　　　■ [[CONV -> RELU]*N -> POOL?]*M
　　　　■ [FC -> RELU]*K
　　　　■ FC