CV baseline之VGG

作业题

1:文字回答:VGG中3个3*3卷积相对于1个7*7卷积,在参数上较少了百分之多少?(假设输入和输出通道数均为C)

1个7x7卷积核所需参数量:7x7xCxC=49C2

3个3x3卷积核所需参数量:3x(3x3xCxC)=27C2

参数减少比:(49-27)/49=44%

2:文字回答:VGG-16和VGG-19差别在哪?

第3、4、5层最后又增加了一个conv-3

3:文字回答:读完该论文,对你的启发点有哪些?

1)采用小卷积核可以获得高精度

2)采用多尺度及稠密预测可以获得高精度

3)1x1卷积可以认为是线性变换,同时增加非线性层

4)填充大小准则:保持卷积后特征图分辨率不变

5)LRN对精度无提升

6)Xavier初始化可达到较好效果

7)S远大于224,图片可能仅包含物体的一部分

8)大尺度模型采用小尺度模型初始化,可加快收敛

9)物体尺寸不一,采用多尺度训练,可以提高精度

10)multi crop存在重复计算,因而低效

11)multi crop可看成dense的补充,因而它们边界处理有所不同

12)小而深的卷积网络优于大而浅的卷积网络

13)尺度扰动对训练和测试阶段都有帮助

14)scheduler=torch.optimize.lr_scheduler.ReduceLROnPlateau(patience=5):当参数不再变化时再减小学习率

4:代码实现:从网上找一张图片,执行vgg16,观察top5输出的类别,并将输出结果截图进行打卡。

 

5.  文字:本篇论文的学习笔记及总结

原文地址:https://www.cnblogs.com/sariel-sakura/p/13433495.html