物体检测与识别——学习笔记

前言

自动驾驶、手势控制、美颜相机

发展:

  • 50-60s 看
  • 70-90s 看懂
  • 90s-2012  识别
  • 2012++理解

传统方法

直线检测、形状检测

ADAS(Advanced Driver Assistant System)高级智能驾驶系统   见:ADAS系统-ADAS|车道偏离预警|前车碰撞预警|行人识别|3D高清全景 http://www.adas.cc/adas/#_20

ADAS的核心功能集中在前车碰撞预警(FCW)、车道偏离预警(LDW)、行人检测预警(PCW)等。

检测圆形:找到一个点到边缘(由边缘检测来)的距离全部相等时,则判定区域覆盖为圆形。

机器学习方法

特征+模型

CNN 卷积层,提取特征类似HOG、LBP、Haar

前面卷积和池化,提取特征

全连接FC,或softmax(本质是将逻辑回归的二分类问题向多分类扩展),分类

卷积核(kernel、window)得到特征图(feature map)

sliding window

原始图滑窗很慢,改为在特征图上滑窗就很快

滑窗大量重复信息

 R-CNN(Regions with CNN features)

Region proposals 500-2000个可能区域。先类似K-means聚类,每一个可能存在东西的部分都进模型检测

NMS 抑制掉周围方块

还是感觉R-CNN框太多了,还是无法实时。

RCNN 提取特征用的是神经网络+SVM分类

Fast RCNN 特征+分类都是神经网络

Faster RCNN ,Region proposals也用神经网络(RPN寻找潜在region)

YOLO 图像分成若干cell,只回归一次,可将图像中所有物体全都提取出来。非常先进、豪华。

bounding box 位置定位

x,y,w,h连续变量——>回归(解决的是在哪)

侦测到物体在哪,画个框

semantic segmantation

图像语义分割  

更精细,像素级

 卷积:

上卷积(反卷积)

端对端

较新的技术:

MASK-RCNN 反卷积形成Mask

U-NET层数比较少,医学图像

【其他资料】

 关于semantic segmentation的几篇论文 - Marcovaldong的博客 - CSDN博客 https://blog.csdn.net/MajorDong100/article/details/78958656

计算机视觉之语义分割 http://blog.geohey.com/ji-suan-ji-shi-jue-zhi-yu-yi-fen-ge/

原文地址:https://www.cnblogs.com/wxl845235800/p/10116495.html