《tf object detection API使用教程--第一讲》VOCtrainval_11-May-2012数据集分析

版权声明:版权归原作者所有。未经允许,严禁转载。 https://blog.csdn.net/luccao/article/details/81943451
  • tar -zxvf VOCtrainval_11-May-2012.tar 后生成VOCdevkit文件夹
  • 打开VOCdevkit文件夹后看到VOC2012
  • 再打开VOC2012就会看到如下文件夹

  • 由于我是用来训练目标识别的,所以我着重关注Annotations, JPEGImages, ImageSets
  1.   JPEGImages包含了所有的图片,包括train和validation的图片,一共有17125张 。这些图片都是以"年份_编号.jpg"的格式命名的,图片的像素大小不一,训练的时候记得resize。
  2. Annotations里面存放的是xml文件,每一个xml文件与JPEGImages的图片一一对应,它是图片的标签文件,打开看看就知道里面记录的是什么信息了。
  3. ImageSets文件夹里面有4个文件夹

         

        其中Action下存放的是人的动作(例如running、jumping等等,这也是VOC challenge的一部分),Layout下存放的是具有人体部位的数据(人的head、hand、feet等等,这也是VOC challenge的一部分),Main下存放的是图像物体识别的数据,总共分为20类。Segmentation下存放的是可用于分割的数据。

        我主要用的是Main文件夹下的数据,一共20类目标,每一类包含train, trainval, val三种数据,都是已经分配好了的。

猜你喜欢

转载自blog.csdn.net/luccao/article/details/81943451
今日推荐