Fcos: Fully convolutional one-stage object detection 论文阅读小结

 Abstract:

  1. FCOS方法是一种anchor的方法,不需要预定义的anchor,避免了由anchor引起的复杂的计算,也减少了针对anchor的超参数,这些超参数对最终的检测结果影响很大。
  2. 只使用了一个NMS后处理程序,FCOS就能以非常简单的特性超过此前的一阶检测器,这篇论文也是第一提出如此简单且灵活的高精度检测框架。
  3. FCOS能够为例如实例分割等任务服务。
  4. ICCV'19,code:https://github.com/tianzhi0549/FCOS

Motivation:

  1. 此前的主流检测器例如Faster R-CNN,SSD,YOLOv2,v3都依赖于预定义的anchor box来取得优异的性能,但是基于anchor box的方法有以下缺点:①检测性能对尺寸、长宽比和anchor box的数量都很敏感。②即使有精心设计的anchor box,由于anchor box的尺度和长宽比都是固定的,检测器对一些具有大的形状变化的候选物体,尤其是对一些小物体,非常具有难度。预定义的anchor box限制了检测器的活化性能,对于新的任务必须重新设计anchor box。③为了达到较高的召回率,必须要输入图像上设置密集的anchor,在训练的过程中,会有大量的anchor box是负例,这使得正例和负例非常不均衡。④大量的anchor box导致了复杂的计算,例如计算IoU score。
  2. 目前的视觉任务例如semantic segmentation、depth estimation、key point detection、counting等都是可以用全卷积网络达到非常好的性能的,但是由于anchor box的使用,在检测上还没有办法应用FCN。因此,自然地会产生一个疑问,能以逐像素的形式,使用FCN解决检测任务吗?本文给出了肯定的答案。并且本文的方法第一次表明,更简单的FCN-based detector能够比anchor-based detector达到更好的性能。
  3. 基于FCN框架的检测器,在特征图的级别上预测一个4D向量和一个类别分数,例如Dense-Box,但是为了解决bounding boxes的不同尺寸,DenseBox将图像裁剪并重置为固定的尺寸,在图像金字塔上进行检测,这违反了FCN只进行一次卷积的初衷。并且这种检测器只能用于检测特定任务,在通用任务上,通常会产生歧义。这篇论文发现FPN可以很好地解决这个问题。
  4. 在检测的过程中会发生很多远离物体中心的低质量的预测框,为了解决这个问题,论文提出了center-ness分支,可以极大地抑制低质量检测框,提高检测性能。

Advantages:

  1. FCOS将检测任务和可用FCN解决的视觉任务,如semantic segmentation等统一到了一起。
  2. FCOS使得检测可以proposal free和anchor free,极大地减少超参数地数量,也使检测器更简单。
  3. FCOS不需要anchor box,可以避免大量的计算,速度更快。
  4. 可以达到SOTA。
  5. FCOS可以立即被扩展以解决其他视觉任务,包括实例分割和key-point detection等。

Contribution:

  1. 提出了FCOS检测框架,将FCN用于解决检测任务,以一种anchor-free的方式达到SOTA。
  2. 提出了center-ness,可以有效抑制低质量的预测框。

Method:

  1. Fully Convolutional One-Stage Object Detector。预测的目标是一个四维向量和一个类别得分。
  2. Multi-level Prediction with FPN for FCOS。使用FPN进行多尺度预测,可以有效缓解重叠边界框预测时的歧义问题。
  3. Center-ness for FCOS。可以有效抑制偏离物体中心的低质量的预测框。

猜你喜欢

转载自blog.csdn.net/PAN_Andy/article/details/104975569