ImageNet大规模视觉识别竞赛 ILSVRC 2015-VID数据集

数据主页:http://bvisionweb1.cs.unc.edu/ilsvrc2015/download-videos-3j16.php#vid

Object detection from video 

视频中的目标检测,简称VID。目前官方已经完全开放了数据集包括3862 snnipets用于训练,555 snippets用于验证, 937 snippets用于测试。数据下载地址:http://bvisionweb1.cs.unc.edu/ilsvrc2015/ILSVRC2015_VID.tar.gz。所有的snippet包括56~458帧图像。

视频中的目标检测,类似目标检测任务的风格。该任务有30个基本类别,是目标检测任务200个基本类别的子集。这些类别都是精心选择的,考虑到不同因素,如运动类型,视频背景干扰,平均目标数目等。所有类别在每个帧都完全打标签。官方使用了Datatang的服务来标记目标框。

30个类别为:

n02691156 1 airplane
n02419796 2 antelope
n02131653 3 bear
n02834778 4 bicycle
n01503061 5 bird
n02924116 6 bus
n02958343 7 car
n02402425 8 cattle
n02084071 9 dog
n02121808 10 domestic_cat
n02503517 11 elephant
n02118333 12 fox
n02510455 13 giant_panda
n02342885 14 hamster
n02374451 15 horse
n02129165 16 lion
n01674464 17 lizard
n02484322 18 monkey
n03790512 19 motorcycle
n02324045 20 rabbit
n02509815 21 red_panda
n02411705 22 sheep
n01726692 23 snake
n02355227 24 squirrel
n02129604 25 tiger
n04468005 26 train
n01662784 27 turtle
n04530566 28 watercraft
n02062744 29 whale
n02391049 30 zebra
对每个视频帧 fi,算法产生一系列标记(fi, ci, si, bi),其中ci 为类标签 ,si 为置信率, bi 为目标框。该集合每帧都包含30个目标类别中的某个实例。评价准则和目标检测任务相同,未标记的目标将被惩罚,重复检测也会被惩罚。在大多数目标类别中获得最高准确率的将会胜出。

猜你喜欢

转载自blog.csdn.net/shenziheng1/article/details/81000883
今日推荐