1、简介

2、数据集特点

COCO 是一个大规模的、用于对象检测、分割和图像描述的数据集。它有以下几个特点:

在这里插入图片描述

大家主要的疑惑点可能在于 80 object categories 和 91 stuff categories ：

stuff categories ：论文中的描述是： “stuff” categories include materials and objects with no clear boundaries (sky, street, grass)，即标注了91类没有明确边界的对象(诸如天空，街道，草地)。
80 object categories 和 91 stuff categories 的区别：论文中用一段文字来描述了它们的区别，简单来说就是80类是91类的一个子集，去掉了一些难以分类和容易混淆的类别，如果做目标检测，基本只用 object 80类。

（2）80个类别
在这里插入图片描述

在这里插入图片描述

目标检测任务、语义分割任务，实例分割任务、图像描述人物、关键点检测任务，只用到我下面框起来的3个文件： (1) 训练集图像文件、(2) 验证集图像文件、(3) 训练集和验证集标注文件
在这里插入图片描述
这里我贴出下载链接
训练集图像 (2017 train)：http://images.cocodataset.org/zips/train2017.zip
验证集图像 (2017 val)：http://images.cocodataset.org/zips/val2017.zip
训练集标注 (2017 annotations): http://images.cocodataset.org/annotations/annotations_trainval2017.zip

数据下载下来后，是如下的文件结构
在这里插入图片描述

以 instances_train2017.json 为例，数据读取进来之后，是一个 dict，包含5个元素：info、licenses、image、annotation、categories

import json

json_path = "COCO2017/annotations/instances_train2017.json"
with open(json_path, 'r') as f:
    json_labels = json.load(f)

在这里插入图片描述

1）info
在这里插入图片描述

2）licenses
在这里插入图片描述

3）image

在这里插入图片描述

4）annotation
在这里插入图片描述

5）categories
在这里插入图片描述