目标检测相关术语

iou

使用loU看检测是否正确需要设定一个阈值,最常用的阈值是0.5,即如果loU>0.5,则认为是真实的检测

P代表每张图像中被检测出的正确目标占总目标数的多少;

AP代表对于一个类别,假如100张图像,计算平均精度;分子是图像的个数,分母是总精度的和;

MAP=所有类别的平均精度求和除以所有类别 ;

AP50,AP60

以Cascade R-CNN的一张图为例,AP50,AP60,AP70……等等指的是取detector的IoU阈值大于0.5,大于0.6,大于0.7……等等。可以看到数值越高,精确率越低,表明越难

ROI

感兴趣区域,往往是需要检测的目标

Hard negative mining 

难检测负样本挖掘

 hard negative就是当你得到错误的检测patch时,会明确的从这个patch中创建一个负样本,并把这个负样本添加到你的训练集中去。当你重新训练你的分类器后,分类器会表现的更好,并且不会像之前那样产生多的错误的正样本。

multi reference detection

多参考检测,直观理解多个检测器。ssd中是用卷积进行检测,最终有8732个卷积detector。

或者是ASPP模块,采用空间金字塔池化技术获取上下文信息(场景信息);这地方理解的不是很清楚,应该是多个检测器。

纠正,最终理解是anchors boxes机制,这里的anchors boxes就是代表了多个检测器,所以第一种理解是对的。

multi resolution detection

多分辨率检测,例如ssd,对于多尺度特征图进行检测;FPN中的多尺度特征图,retinanet中的多尺度特征图等;refinenet中的融合不同分辨率特征图信息;

列出yolo v3和 ssd的结构图更加明显的表示出含义:

YOLO V3结构图,橙色为detection layer

SSD结构图,倒数第二列是detections

多尺度检测技术演进路线图:

常用数据集:

通用目标检测领域常用数据集

行人检测常用数据集

人脸检测常用数据集

文本检测常用数据集

交通灯检测与交通标志检测常用数据集

原文地址:https://www.cnblogs.com/ywheunji/p/10997900.html