使用DPM(Deformable Part Model，voc-release3.1)算法INRIA通过训练你的身体检测模型数据集

我的环境

DPM源代码版本号：voc-release3.1

VOC开发包版本号：VOC2007_devkit_08-Jun

Matlab版本号：MatlabR2012b

c++编译器：VS2010

系统：Win7 32位

learn.exe迭代次数：5万次

数据集：INRIA 人体数据集，等

步骤一，首先要使voc-release3.1目标检測部分的代码在windows系统下跑起来：

在Windows下执行Felzenszwalb的Deformable Part Models(voc-release4.01)目标检測matlab源代码

上文中用的4.01，3.1须要改动的地方是一样的，反而更简单。

步骤二，把训练部分代码跑通，在VOC数据集上进行測试，例如以下文：

在windows下执行Felzenszwalb的Deformable Part Model(DPM)源代码voc-release3.1来训练自己的模型

步骤三，再之后就是使之能在其它的数据集上训练模型，比方INRIA人体数据集。

这一步中主要是改动pascal_data.m文件。这个文件的作用就是读取标注，为训练准备数据。此函数会返回两个数组。pos[]和neg[]，

pos[]中是正样本信息，格式为：[imagePath x1 y1 x2 y2 ]；

neg[]中是负样本信息，格式为：[imagePath] 。

先读取INRIA数据集的标注，保存为以下的格式：

然后在pascal_data.m中读取此文件。依次将标注信息保存到pos[]数组中。注意要将图片路径补全为绝对路径。

    pos = []; % 存储正样本目标信息的数组，每一个元素是一个结构，{im, x1, y1, x2, y2}
    numpos = 0; % 正样本目标个数(一个图片中可能含有多个正样本目标)
    
    % InriaPersonPos.txt是从Inria人体数据集获得的50个正样本的标注文件，格式为[x1 y1 x2 y2 RelativePath]
    [a,b,c,d,p] = textread('InriaPersonPos.txt','%d %d %d %d %s'); % 注意：读取后p的类型时50*1的cell类型
    
    % 遍历训练图片文件名称数组ids
    for i = 1:length(a);
        if mod(i,10)==0
            fprintf('%s: parsing positives: %d/%d
', cls, i, length(a));
        end;
        numpos = numpos+1; % 正样本目标个数
        pos(numpos).im = [VOCopts.datadir p{numpos}]; % 引用cell单元时要用{},引用矩阵单元时用()
        pos(numpos).x1 = a(numpos);
        pos(numpos).y1 = b(numpos);
        pos(numpos).x2 = c(numpos);
        pos(numpos).y2 = d(numpos);
    end

pos(numpos).im 中我也在相对路径前加了VOCopts的数据集文件夹datadir是由于我将INRIA数据集放在VOCdevkit文件夹下了。

这里要特别注意的是。不须要提前从INRIA数据集中依据标注文件手动裁出人体目标，而是将标注信息和正样本原图都告诉DPM算法，它自己主动会进行缩放、剪裁处理。对于有的标注信息超过图像边界的，也没关系，DPM中也会自己处理。

至于负样本就无所谓了，反正都是从不含人体的原图上随机裁取，还用VOC数据集中的即可。

以下展示几个训练的模型，以及检測结果

（1）50个INRIA正样本目标。300个VOC负样本目标。单组件(component)模型，部件个数为6。

模型可视化图例如以下：