【数据集研究】MS COCO


1、简介

  • MS COCO :Microsoft Common Objects in Context

  • MS COCO 是一个由微软公司创建的用于图像识别和物体检测的大型数据集。

  • MS COCO 数据集有两个版本:MS COCO 2014 和 MS COCO 2017。 这里我们介绍 2017版本
    2017版数据集 是对 2014版数据集 的扩展和更新,2017版 较 2014版 的变化有:

    • 2017版 和 2014版 使用完全相同的图像
    • 2017版 训练集/验证集 的划分是118K/5K,而 2014版 是 83K/41K
    • 2017版中用于 检测类任务 / 关键点检测 的注释 和 2014版 是一样的, 但是增加了 40K 张训练图像 (118k 训练集中的子集) 和 所有验证集 的stuff 标注 (后面有介绍 stuff categories)
    • 2017年的测试集只有两个部分(开发集/挑战集),而2014版的测试集有四个部分(开发集/标准集/储备集/挑战集)。
    • 2017版 发布12万张来自COCO的无标记图像,这些图像遵循与标记图像相同的类分布 ,可用于半监督学习。

官网地址:https://cocodataset.org/
官方论文: https://arxiv.org/pdf/1405.0312.pdf


2、数据集特点

COCO 是一个大规模的、用于 对象检测、分割 和 图像描述的 数据集。它有以下几个特点:

在这里插入图片描述

大家主要的疑惑点可能在于 80 object categories91 stuff categories

  • stuff categories :论文中的描述是: “stuff” categories include materials and objects with no clear boundaries (sky, street, grass),即标注了91类没有明确边界的对象(诸如天空,街道,草地)。
  • 80 object categories91 stuff categories 的区别:论文中用一段文字来描述了它们的区别,简单来说就是80类是91类的一个子集,去掉了一些难以分类和容易混淆的类别,如果做目标检测,基本只用 object 80类。

(2)80个 类别
在这里插入图片描述


3、MS COCO 数据集 支持的计算机视觉任务

在这里插入图片描述


4、MS COCO 2017 数据集 下载

目标检测任务、语义分割任务,实例分割任务、图像描述人物、关键点检测任务, 只用到我下面框起来的3个文件: (1) 训练集图像文件、(2) 验证集图像文件、(3) 训练集和验证集标注文件
在这里插入图片描述
这里我贴出下载链接
训练集图像 (2017 train):http://images.cocodataset.org/zips/train2017.zip
验证集图像 (2017 val):http://images.cocodataset.org/zips/val2017.zip
训练集标注 (2017 annotations): http://images.cocodataset.org/annotations/annotations_trainval2017.zip

数据下载下来后,是如下的文件结构
在这里插入图片描述


5、MS COCO 文件标注格式

以 instances_train2017.json 为例,数据读取进来之后,是一个 dict,包含5个元素:info、licenses、image、annotation、categories

import json

json_path = "COCO2017/annotations/instances_train2017.json"
with open(json_path, 'r') as f:
    json_labels = json.load(f)

在这里插入图片描述

1)info
在这里插入图片描述

2)licenses
在这里插入图片描述

3)image

在这里插入图片描述

4)annotation
在这里插入图片描述

5)categories
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/weixin_37804469/article/details/129800790