VOC2012数据集注解

VOC2012官网介绍:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/index.html

分割部分:参考博客:https://blog.csdn.net/haoji007/article/details/80361587?tdsourcetag=s_pcqq_aiomsg

检测部分:参考博客:https://blog.csdn.net/wenxueliu/article/details/80327316

先对整个文件结构做一个梳理,文件目录如下:

上图中:

(1)JPEGImages文件夹存储了17125张图片,目前已知:有11540张用于检测任务;

(2)Annotations文件夹存储每张图片中标注信息(.xml),格式如下:

(3)ImageSets文件中:

 

其中:Action存储人的动作,Layout存储人的部位,Segmentation存储分割,Main存储检测索引;其中Main中,每个类都有对应的classname_train.txt、classname_val.txt和classname_trainval.txt三个索引文件,分别对应训练集,验证集和训练验证集(即训练集+验证集)。另外还有一个train.txt(5717)、val.txt(5823)和trainval.txt(11540)为所有类别的一个索引。注意:VOC2012中没有了测试集,而是采用在线评测的方式;

classname_train.txt的格式如下:

上图中:1表示该图片中含有该类目标,-1表示该图片不含有该类目标,0表示该图片中含有该类目标,但difficlut=0(即难以识别,作直接跳过处理);

原文地址:https://www.cnblogs.com/zf-blog/p/10638610.html