CV baseline之VGG

作业题

1：文字回答：VGG中3个3*3卷积相对于1个7*7卷积，在参数上较少了百分之多少？（假设输入和输出通道数均为C）

1个7x7卷积核所需参数量：7x7xCxC=49C²

3个3x3卷积核所需参数量：3x(3x3xCxC)=27C²

参数减少比：（49-27）/49=44%

2：文字回答：VGG-16和VGG-19差别在哪？

第3、4、5层最后又增加了一个conv-3

3：文字回答：读完该论文，对你的启发点有哪些？

1）采用小卷积核可以获得高精度

2）采用多尺度及稠密预测可以获得高精度

3）1x1卷积可以认为是线性变换，同时增加非线性层

4）填充大小准则：保持卷积后特征图分辨率不变

5）LRN对精度无提升

6）Xavier初始化可达到较好效果

7）S远大于224，图片可能仅包含物体的一部分

8）大尺度模型采用小尺度模型初始化，可加快收敛

9）物体尺寸不一，采用多尺度训练，可以提高精度

10）multi crop存在重复计算，因而低效

11）multi crop可看成dense的补充，因而它们边界处理有所不同

12）小而深的卷积网络优于大而浅的卷积网络

13）尺度扰动对训练和测试阶段都有帮助

14）scheduler=torch.optimize.lr_scheduler.ReduceLROnPlateau(patience=5):当参数不再变化时再减小学习率

4：代码实现：从网上找一张图片，执行vgg16，观察top5输出的类别，并将输出结果截图进行打卡。

5. 文字：本篇论文的学习笔记及总结