VGGNet

介绍

VGGNet探索了CNN的深度与其性能之间的关系,反复堆叠3*3卷积核(pad=1,stride=1)和2*2最大池化核(pad=0,stride=2),16~19层深的卷积神经网络。

VGGNet常被用来提取图像特征。

 

 

主要是VGG16,19

特征提取器层是不一样的,主要每一行卷积的深度不一样,

总共划分为五段卷积层

全连接层有4096个神经元

fc3有1000个神经元,线性输出层

每个conv出来之后自带一个relu

drop主要是为了防止分类器的过拟合,如果参数特别多,特征空间就划分的很凌乱,容易过拟合。加了个dropout加入了正则化约束,表现得像一层一样,我这个通道以一定的概率保持通状态,一定的概率保持闭状态。

 参数更少;卷积层越多,非线性变换就可以越多,学习能力越强

先训练a

scal是尺度,图像分析里面有个叫多尺度分析的的方法,例如小波变换。

multi_scale多尺度变换,归一化到一个尺寸q

多尺度预测的过程,给了原始图像之后,训练样本的尺寸有可能是非常小的,也有可能是非常大的,怎么办呢,一方面是再训练的过程中,对不通图像做不同尺度的调整。这样模型就能识别不同尺度的图像,测试的时候也做不同尺度的调整

数据增强的意思是:比如说输入的图像时32*32,可以缩放到16*16/128*128/64*64.。。这样添加多个不同尺度的版本数据,然后来训练这个网络

补充VGG16

conv: kernel=3x3 , pad=1 , stride=1

maxpool: kernel=2x2 , pad=0 , stride=2

 

 

原文地址:https://www.cnblogs.com/pacino12134/p/9790505.html