(论文分析) Object Detection -- Object Class Recognition by Unsupervised Scale-Invariant Learning

Object Class Recognition by Unsupervised Scale-Invariant Learning

作者提出了一个概率模型，其被用来对目标的一些方面（属性）进行概率描述——如形状、表观、遮挡、以及相对尺度。除此之外，一个基于熵（entropy-based）的特征检测被用来选择在图像中的区域以及尺度。对于学习尺度不变目标检测模型的参数时，依靠EM算法实现。在识别过程中，这个模型以贝叶斯方式来进行对图像分类。

方法描述

object model由大量的parts组成，每个part有一个 appearance , relative scale 并且还可能被遮挡。形状是由parts之间的相互位置进行表示。Appearance, scale, shape 以及遮挡判断都采用gaussian 密度函数进行描述。学习一个object category的过程就是首先检测区域和相应的尺度，然后从这些区域中估计模型的参数，以至于模型拥有最大似然（对训练数据）。

模型结构

对于一副图像，我们检测到个感兴趣特征点，其位置为，尺度为，以及表征为，从而

贝叶斯决策公式（我们使用这个决策式子对目标是否存在进行判断）：

对于这个决策公式我们需要计算模型对训练数据的似然

因为我们的模型仅仅有个parts，但是在这个图像上有N个特征，因而我们有必要从N个特征中挑选出P个parts。基于这个考虑我们引入一个indexing variable ，我们称之为。是一个长度为的向量，其中每一项的数值为从0到N，其表示哪个特征作为模型的part。未分配的特征被认为是背景的parts。如果是0表示这个 part是被遮挡的，不可用。