YOLOv3

YOLOv3

作者:Joseph Redmon

CVPR'18

paper:YOLOv3: An Incremental Improvement

亮点

  • 提出新的backbone-darknet53
  • 没有池化层和全连接层
  • 增加了分支,用于检测小目标对象(13$ imes(13, 26) imes(26, 52) imes$52)

网络结构

YOLOv3除去了池化层和全连接层,用卷积操作代替。

引入了残差结构,使得backbone更深。

对不同层的输出进行上采样拼接,增加了2条分支,用于预测小目标。每条分支最后的输出深度为255,原因是每条分支包括3个anchor,并且针对COCO80个种类设计,每个位置需要预测4个偏移量和1个置信度,3( imes)(5+80)=255

bounding box的预测:和YOLOv2类似,每个网格的左上角坐标为((c_x,c_y)),bounding box有先验长宽,使用预测值调整bounding box的边界。

每个框有个objectness分数(置信度,逻辑回归预测),bbox和GT的IOU大于0.5并且IOU最大的为1,作为正样本;其余大于0.5的舍弃,小于0.5的作为负样本,这样做可以舍弃不必要的anchor,减少计算。

如果一个bbox没有被分配到GT,就不计算候选框损失和分类损失,只计算objectness损失。

分类预测:没有使用softmax分类器。

原文地址:https://www.cnblogs.com/xiaowk/p/15155601.html