什么是MOT(Mutil-Object-Tracking)
MOT
英文全称叫Mutil-Object-Trackin
g,中文叫多目标跟踪,从字面意思来讲就是对多个目标对象进行跟踪
。具体来说就是在一段视频当中我们要得到我们比较感兴趣的物体的运动轨迹。这里的运动轨迹包括检测框以及检测对象的类别还有检测对象的编号(ID))
类别
:在行人的跟踪识别情况下只有一个类别就是行人,在一些多类别的场景中就会有行人、车辆
ID
:基本是固定的,在场景中一般是不会变化的,如果发生了变化就证明出现了错误。
多目标跟踪任务里面大家用的比较多、比较实用的范式,是Tracking-by-detection
(先检测后跟踪),这种范式分为两步,第一步
是先用目标检测算法得到目标的检测框,第二步
,使用Data association
的方法将不同帧之间的监控框进行匹配,得到ID
。
Data association
先对视频内的第一帧进行检测,对不同的检测框赋上不同的id,图中不同颜色的框就代表了不同的id。从第二帧开始继续检测目标,但是检测过程是不赋上id的,我们通过data asso