版权声明:版权归原作者所有。未经允许,严禁转载。 https://blog.csdn.net/luccao/article/details/81943451
- tar -zxvf VOCtrainval_11-May-2012.tar 后生成VOCdevkit文件夹
- 打开VOCdevkit文件夹后看到VOC2012
- 再打开VOC2012就会看到如下文件夹
- 由于我是用来训练目标识别的,所以我着重关注Annotations, JPEGImages, ImageSets
- JPEGImages包含了所有的图片,包括train和validation的图片,一共有17125张 。这些图片都是以"年份_编号.jpg"的格式命名的,图片的像素大小不一,训练的时候记得resize。
- Annotations里面存放的是xml文件,每一个xml文件与JPEGImages的图片一一对应,它是图片的标签文件,打开看看就知道里面记录的是什么信息了。
- ImageSets文件夹里面有4个文件夹
其中Action下存放的是人的动作(例如running、jumping等等,这也是VOC challenge的一部分),Layout下存放的是具有人体部位的数据(人的head、hand、feet等等,这也是VOC challenge的一部分),Main下存放的是图像物体识别的数据,总共分为20类。Segmentation下存放的是可用于分割的数据。
我主要用的是Main文件夹下的数据,一共20类目标,每一类包含train, trainval, val三种数据,都是已经分配好了的。