coco数据集理解(一)

coco :(MS) COMMON Objects in context

(牛逼的数据集 都有相应的论文的 如coco
iamgenet:分类数据集
coco:目标检测,关键点检测,
研究某个问题,首先花一定的时间探索一下baseline数据集以及关于此数据集的论文。)

认为场景理解的一个核心是 获得 目标在空间上的精确位置:

这个位置可以通过两种方式定义:

1. 直接bbox框出来--对物体做目标级的定位------coarsely

2. 实力分割---对物体做 像素级的定位----(其实实例分割就是更加precisely的目标检测)

提出coco数据集,并利用DPM第一次做了实例分割任务,希望能更精确的衡量检测器;在person 类别上的检测map仅有15.4

思路:
使用ijson读取json文件遍历
annotation和images唯一的联系就是image-id

1.首先遍历annotation对象,将含person的id的annotation保存到新的对象中;同时保存image_id到一个列表image_list中。
2.对image_list列表去重,然后用这个列表去读取images对象,ID匹配到的保存到新的images数组。

coco中:

  1. 目标检测针对:动态目标 things(前景物)
  2. stuff task: 针对 草,墙,天空 这种静态目标。(背景物)
  3. detection 标注针对前景,stuff标注针对背景,panopatic针对全景。
  4. keypoints标注:是全部图片中person类的mask标注了关节点。

检测(包括关键点检测)和分割就是coco数据集
视频动作:找个数据集
多目标跟踪:找个数据集
分类:找个数据集

object detection:
1.common object detection
2.precisly object detection(instance segmentation)
因此,在coco数据集中,做检测和分割只需要下载 instance train/val ---2017之后会新增任务但是原类别的标注是不变的,比如instances标注
关键点检测,需要下载person_keypoints train/val(注释中包含了instance 数据集中的部分注释)

coco2017:
train/val:118K:5k
test:dev/challenge
还发布了120K张无标签的img,方便半监督学习使用。

Please note that:请注意 coco api可以获取并处理annotations

{ }:一个json对象,即一个字典数据结构
[{obj1},{obj2}]:多个字典对象放到列表里,就成了json数组(json对象列表)。

json是指文件类型,json文件类型采用字典数据结构组织数据。

json文件内部就是一个大的dict()

Dadroit软件:

打开json文件时,每个[0][1]...的地方都是一个json数组(即列表)

原文地址:https://www.cnblogs.com/Henry-ZHAO/p/14259581.html