google detection

paper: Scalable, High-Quality Object Detection

ILSVRC14上，detection刷到55.7%的MAP，google插入的地方，别人倍感压力啊。

总体结果，其实我觉得很好的地方是，时间短，效果也很不错呢。就只用multibox就能达到50.7%的MAP，相当赞啊。

但是，用selective search的效果是51.3%，也是令人震惊啊。

总体multibox的思路就是网络的输入一副整图，输出有两个，一个输出是confidence，一个输出是坐标，当然这两个都是vector，也就是说很多个confidence和很多组对应的坐标，两者之间的关系是4倍的关系。这个思路他们之前也用过，但是之前用的是经典的CNN，效果并不比RCNN好，现在他们改用今年google参加竞赛的inception网络了，效果提升了很多很多。

另外一个亮点是，用context post classifier，这个效果也提升了很多，这个网络也是类似于inception的结构的，具体可以看看文章中说到。

google的文章确实很不好读啊，写的太不明白啊。

转载请注明出处，谢谢。