coco数据集理解（一）

coco :(MS) COMMON Objects in context

（牛逼的数据集都有相应的论文的如coco
iamgenet：分类数据集
coco:目标检测，关键点检测，
研究某个问题，首先花一定的时间探索一下baseline数据集以及关于此数据集的论文。）

认为场景理解的一个核心是获得目标在空间上的精确位置：

这个位置可以通过两种方式定义：

1. 直接bbox框出来--对物体做目标级的定位------coarsely

2. 实力分割---对物体做像素级的定位----（其实实例分割就是更加precisely的目标检测）

提出coco数据集，并利用DPM第一次做了实例分割任务，希望能更精确的衡量检测器；在person 类别上的检测map仅有15.4

思路：
使用ijson读取json文件遍历
annotation和images唯一的联系就是image-id

1.首先遍历annotation对象，将含person的id的annotation保存到新的对象中；同时保存image_id到一个列表image_list中。
2.对image_list列表去重，然后用这个列表去读取images对象，ID匹配到的保存到新的images数组。

coco中:

目标检测针对：动态目标 things（前景物）
stuff task: 针对草，墙，天空这种静态目标。（背景物）
detection 标注针对前景，stuff标注针对背景，panopatic针对全景。
keypoints标注：是全部图片中person类的mask标注了关节点。

检测（包括关键点检测）和分割就是coco数据集
视频动作：找个数据集
多目标跟踪：找个数据集
分类：找个数据集

object detection：
1.common object detection
2.precisly object detection（instance segmentation）
因此，在coco数据集中，做检测和分割只需要下载 instance train/val ---2017之后会新增任务但是原类别的标注是不变的，比如instances标注
关键点检测，需要下载person_keypoints train/val(注释中包含了instance 数据集中的部分注释)

coco2017:
train/val:118K:5k
test：dev/challenge
还发布了120K张无标签的img，方便半监督学习使用。

Please note that：请注意 coco api可以获取并处理annotations

{ }:一个json对象，即一个字典数据结构
[{obj1},{obj2}]:多个字典对象放到列表里，就成了json数组（json对象列表）。

json是指文件类型，json文件类型采用字典数据结构组织数据。

json文件内部就是一个大的dict()

Dadroit软件：

打开json文件时，每个[0][1]...的地方都是一个json数组（即列表）