CV baseline之GoogLeNet

作业内容

1:文字回答:GoogLeNet采用了几个辅助损失?辅助损失函数的权重是多少?为什么要采用辅助损失函数?

在Inception4b和Inception4e增加两个辅助分类层,用于计算辅助损失,对于每种辅助损失,论文中使用的权重值为0.3。作用:loss回传;充当正则约束,迫使中间层特征也能具备分类能力

2:文字回答:Inception模块中有几个分支?分别是哪些操作?Inception模块输出时特征图采用什么方式融合?

4个分支,1)有128个卷积核的1x1卷积  2)进行64个卷积核的1x1卷积,然后192个卷积核的3x3卷积 3)64个卷积核的1x1卷积,96个卷积核的5x5卷积  4)3x3 pool层,64个卷积核的1x1卷积

特征融合:GoogLeNet应用了赫布理论(the Hebbian principle:一起激发的神经元连在一起),Inception将各个分支所生成的特征图按照从左往右将通道加在一起,然后融合输出。其中,每个分支的特征图到紧挨在一起的,这也体现了赫布理论。

3:文字回答:读完该论文,对你的启发点有哪些?

1)池化损失空间分辨率,但在定位、检测和人体姿态中仍应用。即定位、检测和人体姿态识别这些任务十分注重空间分辨率信息

2)增加模型深度和宽度,可有效提升性能,但有两个缺点:容易过拟合,以及计算量过大

3)为节省内存消耗,先将分辨率降低,再堆叠使用Inception module

4)最后一个全连接层,是为了更方便的微调,迁移学习

5)网络中间层特征对于分类也具有判别性

6)学习率下降策略哦为每8个epochs下降4%(loss曲线很平滑)

7)数据增强指导方针:尺寸在8%-100%;2.长宽比在[3/4,4/3];3.光照畸变有效

8)随机采用差值方法可提升性能

9)实际应用中没必要用144 crops

4:代码实现:从网上找一张图片,执行GoogLeNet,观察top5输出的类别,并将输出结果截图进行打卡。

 

img: Golden Retriever from baidu.jpg is: golden retriever
207 n02099601 狗, golden retriever

 

5.文字:本篇论文的学习笔记及总结

原文地址:https://www.cnblogs.com/sariel-sakura/p/13440266.html