【DOTA】目标检测数据集介绍与使用

every blog every motto: You can do more than you think.
https://blog.csdn.net/weixin_39190382?type=blog

0. 前言

DOTA 数据集简单介绍

1. 正文

1.1 简介

数据集包含来自不同的传感器和平台的航拍图。每张图像的像素尺寸在 800 × 800 到 20,000 × 20,000 之间,其中包含不同大小、方向和形状的物体。

时间 类别 图片数 实例数 图片尺寸
V1.0 2018 15 2806 188, 282 800~20,000
V1.5 2019 16 2806 403,318 800~20,000
V2.0 2021 18 11,268 1,793,658 800~20,000

V1.5和V1.0图片个数相同,只是标注更加精细,各数据集图片数量为:

  • train: 1411张
  • val: 458张
  • test: 937张

下载地址:https://captain-whu.github.io/DOTA/dataset.html(推荐使用google driver下载)

在这里插入图片描述

标注方式:oriented bounding box 定向边界框,标签如下
在这里插入图片描述

'imagesource':imagesource
'gsd':gsd
x1, y1, x2, y2, x3, y3, x4, y4, category, difficult
x1, y1, x2, y2, x3, y3, x4, y4, category, difficult
...
imagesource: 图片来源  Google Earth, GF-2 and JL-1 satellite 
gsd: 分辨率
x1, y1, x2, y2, x3, y3, x4, y4:四边形的四个顶点的坐标 顶点按顺时针顺序排列,第一个起点为左上第一个点
category:实例类别
difficult:表示该实例是否难以检测(1表示困难,0表示不困难)

任务:

  • obb (oriented bounding boxes ): 定向包围框,即旋转框
  • hbb (horizontal bounding boxes): 水平框,即一般的目标检测

下载完文件,将文件解压合并,如下图红框所示即可:

在这里插入图片描述

1.2 切割

官方工具下载:https://captain-whu.github.io/DOTA/code.html (下载development kit即可)

主要用到如下代码:

  • DOTA.py 加载图片并绘制目标边框
  • ImgSplit.py 分割数据集
  • ResultMerge.py 将被分割数据集的检测结果合并,便于后续评估模型性能
  • dota_×_evaluation_task×.py 评估模型性能

DOTA.py加载图片,显示如下:

在这里插入图片描述

切割后如下:

在这里插入图片描述

文件名含义:P0000__1__0___924.png,resize为原来的1倍,在width=0,height=924处进行切割。

在这里插入图片描述

参考

[1] https://captain-whu.github.io/DOTA/index.html
[2] https://blog.csdn.net/echoson/article/details/120347766#:~:text=DOTA%E6%95%B0%E6%8D%AE,%5BDOTA%20Dataset%5D%E6%98%AF%E8%88%AA%E7%A9%BA%E5%BD%B1%E5%83%8F%E4%B8%AD%E7%89%A9%E4%BD%93%E6%A3%80%E6%B5%8B%E7%9A%84%E6%95%B0%E6%8D%AE%E9%9B%86%EF%BC%8C%E5%8C%85%E5%90%AB2806%E5%BC%A0%E5%9B%BE%E5%83%8F%EF%BC%8C%E6%AF%8F%E5%BC%A0%E5%9B%BE%E5%83%8F4000%2A4000%E5%88%86%E8%BE%A8%E7%8E%87%E3%80%82

猜你喜欢

转载自blog.csdn.net/weixin_39190382/article/details/129027401
今日推荐