VOC2012数据集注解

VOC2012官网介绍：http://host.robots.ox.ac.uk/pascal/VOC/voc2012/index.html

分割部分：参考博客：https://blog.csdn.net/haoji007/article/details/80361587?tdsourcetag=s_pcqq_aiomsg

检测部分：参考博客：https://blog.csdn.net/wenxueliu/article/details/80327316

先对整个文件结构做一个梳理，文件目录如下：

上图中：

（1）JPEGImages文件夹存储了17125张图片，目前已知：有11540张用于检测任务；

（2）Annotations文件夹存储每张图片中标注信息(.xml)，格式如下：

（3）ImageSets文件中：

其中：Action存储人的动作，Layout存储人的部位，Segmentation存储分割，Main存储检测索引；其中Main中，每个类都有对应的classname_train.txt、classname_val.txt和classname_trainval.txt三个索引文件，分别对应训练集，验证集和训练验证集（即训练集+验证集）。另外还有一个train.txt（5717）、val.txt（5823）和trainval.txt（11540）为所有类别的一个索引。注意：VOC2012中没有了测试集，而是采用在线评测的方式；

classname_train.txt的格式如下：

上图中：1表示该图片中含有该类目标，-1表示该图片不含有该类目标，0表示该图片中含有该类目标，但difficlut=0(即难以识别，作直接跳过处理）；