目标检测,主要问题发展,非极大值抑制中阈值也作为参数去学习更满足end2end,最近发展趋势和主要研究思路方向

目标检测,主要问题发展,非极大值抑制中阈值也作为参数去学习更满足end2end,最近发展趋势和主要研究思路方向

待办

目标检测问题时间线

特征金字塔加滑窗
对象框推荐
回归算法回归对象框
多尺度检测
BBOX 回归发展
NMS技术发展
困难样本挖掘技术发展--样本不均衡问题
https://zhuanlan.zhihu.com/p/98756890

目标检测的加速方式

https://zhuanlan.zhihu.com/p/98756890

最新进展

1、更好的引擎

DenseNet,在残差网络的基础上进行修改,残差是有short cut链接,而denseNet块是前面所有的层都与后面层有链接,所以是稠密链接。
https://zhuanlan.zhihu.com/p/98756890

2、更好的特征

特征融、合特征融合一般有两种方法,第一种是Processing flow,第二种是Element-wise operation。

3、不止于滑窗

很多方法都是基于proposals或者anchor的方法来做目标检测,但是最近非常流行anchor free

4、目标定位能力的提升

提升定位能力,一般有两种方式

重新修正bbox,bbox refinement经常被用来在cnn中新加入一个分支来重新定位Bbox的位置。
重新设计损失函数,因为目前大部分的损失函数设计都是通过计算IoU来得到定位的loss,这样对于end2end的思想还是相差的有点远,如果能够重新设计一个loss函数来更好的表示定位误差,这样训练过程会更加的好。

5、带语义监督信号的学习

在训练过程中,我们标注的都是矩形框,矩形框中或多或少都会标有一部分背景信息,如果没有语义信息,那么这种训练其实是不完美的。甚至于有些目标的外形比较奇怪,例如一个猫和一个非常长的火车,如果计算IoU的话,这样计算结果就不能很好的表示定位误差。如果带有语义信息的训练,然后使用多任务的损失函数,这样可以帮助到网络进行很好的学习。

6、training from scratch

现在的深度学习的网路训练之前,都是将主干网路在imageNet上进行预训练的,因为ImageNet数据集足够大,预训练之后再在目标检测的数据集上进行微调,这样会容易收敛。但是ImageNet是分类任务的,可能会和目标检测适应的不是那么好。最近有文章研究怎么去重头开始训练并提升精度,例如DSOD就是一个非常好的例子。

7、对抗训练

将GAN思想应用到目标检测中,特别是可以提高小目标和重叠目标的检出率,通过缩小小目标和大目标之间的表达范围,对抗网络生成拥挤的对象掩模,直接在特征层缩小拥挤程度,造成对抗攻击,提升网络学习能力。

8、弱监督训练

目标检测的数据集整理非常耗费人力去标注,通过弱监督学习训练目标检测,只需要在图片层面进行标注,不需要bbox层的标注就可以训练一个目标检测器

猜你喜欢

转载自www.cnblogs.com/lishikai/p/12377048.html
今日推荐