卷积神经网络

传统监督学习过程：y = h(x)

图像作为输入的神经网络：

减少参数量：1神经元局部的连接，关注图像局部特征2空间上参数共享，保持图形特征的空间信息；

CNN的发展史LeNet、Alexnet 、VGG、GoogleNet、ResNet（残差网络）。

残差网络之前，卷积层的层数不超过20层。

残差网络使得深层卷积网络成为可能。

深度学习框架：

pytorch：由facebook提出，在计算机视觉的顶会上面应用很多。

tensorflow：Google提出。

（0）数据划分：Train + Validation + Test

（1）数据预处理-数据归一化

（2）参数初始化：初始为f服从（0,1）的高斯分布，加载预训练模型。100万的数据集训练出来的效果很好，但是自己收集到1000-2000个数据集，这时，可以把100万里面的数据拿到自己的数据集里面来。

迁移学习：关于参数的初始化，可以用一个大的模型进行自己模型的初始化。

（3）学习率，是一个超参数。

梯度下降法

学习率需要人为设定，因为是一个超参，设定方式：

1、前期观察损失函数变化趋势选择大致合适的学习率；

2、对比不同学习率得到的损失函数收敛值

固定学习率的问题：考虑二元函数，无论选择多大的学习率，手链都很慢！

自适应优化器（参数更新）：现在深度学习框架里面有提供。

1、Momentum：避免梯度急剧下降。

2、RMSprop

3、Adam

Mini-Batch梯度下降法

（4）模型正则化策略-Dropout

训练过程中随机将某些神经元设置为0，避免过拟合。

防止过拟合的其他策略：训练提前终止。

参考链接：https://zhuanlan.zhihu.com/p/161738585

https://www.pianshen.com/article/39961694615/

https://blog.csdn.net/u012328159/article/details/80311892

雪儿言