目标检测YOLO算法-学习笔记

算法发展及对比:

17年底,mask-R CNN

 YOLO

YOLO最大的优势就是快

原论文中流程,可以检测出20类物体.

红色网格-张量,在这样一个1×30的张量中保存的数据

横纵坐标中心点缩放到0-1之间

 每一个小网格矩形对应两个不同尺寸比例的物体:竖条,长条;单数是竖着的苗条框,偶数是横着的宽框.

bb1和bb2,两个box 分别保存中心点坐标,宽度,高度,置信度

张量后20为,认为其是某一类的当前概率值,置信

后20:是20个之中的哪一类,打个分.

bb1和bb2中也有个置信度,是其box中是否有物体的置信度.(待定)

循环遍历7*7=49个网格grid cell,每个网格两种矩形去预测bb1和bb2,存是不是物体*物体哪一类,两个值相乘:

共7*7=49,*2=98个

检测过程

 

细节过程

98个box,20类物体

对,是狗的打分

设定阈值是0.2,即如果里面预测类别置信的值小于0.2,令其=0

概率排序(降序)大在前:

对排序后的某些类别...

NMS:非极大值抑制,Non-Maximum Suppression

不同位置的框内,概率不同:

 比较,比它小的非0值

 

IOU:两个区域交集和并集的比例

IOU>0.5认为两个框重合的比较多.置为0.之后迭代循环

 

 (二)递归,以0.2

 

(三)

 后续流程:draw

 

对bb3(20×1)类别的分数,找分数对应最大类别的索引.---->class

bb3(20×1)中最大的分---->score

YOLO很快,tiny更快

端到端的

可以和Fast R-CNN合并

YOLO v.1 v.2

主要应用

智能驾驶

医疗

链接

Arxiv:https://arxiv.org/abs/1506.02640

Blog:http://pjreddie.com/publications/yolo/

Darknet:https://github.com/pjreddie/darknet

Caffe:https://github.com/xingwangsfu/caffe-yolo

Tensorflow:

  Test+train:https://github.com/thtrieu/yolotf

  Test:https://github.com/gliese581gg/YOLO_tensorflow

 

原文地址:https://www.cnblogs.com/wxl845235800/p/10089127.html