RCNN

RCNN(Regions with CNN features)是RGB在2014年提出的一种目标检测算法,RCNN是将CNN方法应用道目标检测问题上的一个里程碑,借助CNN良好的特征提取和分类性能,通过RegionProposal方法实现目标检测。

前面我们提到的滑动窗口法可以得到目标所在区域,但会产生大量的计算。除了滑动窗口法之外还有另外一类基于区域(regionProposal)的方法,select search就是其中之一。

selective search

step1 计算区域集R里每个相邻区域的相似度s = {s1,s2,。。。}

step2 找出相似度最高的两个区域,将其合并为新集Rt,添加进R

step3 从S中移除所有与step2中有关的子集

step4 重新计算新集Rt与所有子集的相似度

这里相似度主要考虑颜色,纹理,chicun,交叠四个方面

算法流程:

1)选择1个分类模型(比如AlexNet,VGGNet等)

2)去掉最后一个全连接层(主要要改变分类数)

  将分类数改为N(该目标分类)+1(背景)对于ILSVRC2013,分类数为200

  对该模型做fine-turning(主要是优化卷积层和池化层的参数)也包括BN操作中的缩放因子γ和偏置因子β

  

3)论文中用(vgg16)到的网络pool5后面是一层fc6全连接层。

对每个候选区域进行特征提取:

Resize区域大小,然后做一次前向运算,将第5个池化层输出保存到硬盘

 

 4)训练阶段:

  使用pool5输出的图像特征训练svm分类器(二分类)来判断这个候选框里面的物体类别。

  测试阶段:

  每个类别对应一个svm,判断是不是属于这个类别,下面是svm

 

 5)训练阶段:

  使用pool5输出的图像特征训练回归器(dx,dy,dw,dh)

   dx表示水平平移,dy表示垂直平移,dw表示水平缩放,dh表示高度缩放

  如何判断候选区域为好的框,计算候选框与真实框之间的IoU,当Iou大于一定阈值,则为真

  测试阶段使用回归器调整候选框大小。

  

  

原文地址:https://www.cnblogs.com/cropmodel/p/13387052.html