机器学习笔记 - SAHI:切片辅助超推理与小目标检测的微调论文简读

一、简述

        对场景中的小物体和远处物体的检测是目标检测中的一个主要挑战。因为图像中的小物体缺乏足够的细节,使得传统检测器很难检测到它们。这里论文作者提出了一个名为切片辅助超推理(SAHI)的开源框架,为小对象检测提供了一个通用的切片辅助推理和微调管道。所提出的技术是通用的,因为它可以应用于任何可用的物体检测器之上,而无需任何微调。

        所提出的技术已与Detectron2、MMDetection和YOLOv5模型集成。

二、检测小目标的困难

        当前多种对象检测算法,例如Faster RCNN,YOLO,SSD,RetinaNet,EfficientDet等。通常,这些模型是在 COCO数据集上进行训练的。它是一个包含各种对象类别和注释的大型数据集,使其在训练对象检测器中很受欢迎。然而,事实证明,这些模型对于小目标的检测并不是特别良好。

        主要原因大致有以下几条:

        感受野有限:感受野是指影响卷积神经网络 (CNN) 中特定神经元或滤波器输出的输入图像的空间范围。在正常的物体检测器中,感受野可能是有限的,这意味着网络可能对较小物体周围的上下文信息没有足够的理解。因此,由于感受野不足,探测器可能难以准确检测和定位这些物体。

        特征细节少:对象检测器通常依赖于 CNN 架构中的学习特征来识别对象。然而,特征表示的固有局限性可能会阻碍对较小物体的检测,因为学习的特征可能无法充分捕获微妙和复杂的细节。

        目标尺度变化过大:与图像中的较大对象相比,小对象表现出

猜你喜欢

转载自blog.csdn.net/bashendixie5/article/details/131100123