YoloV8改进策略:Shape-IoU,考虑边框形状与尺度的度量

摘要

本文尝试使用最新的Shape-IoU改进YoloV8,在我自己的数据集上实现了涨点。

论文:《Shape-IoU:考虑边框形状与尺度的度量》

https://arxiv.org/pdf/2312.17663.pdf
作为检测器定位分支的重要组成部分,边界框回归损失在目标检测任务中发挥着重要作用。现有的边界框回归方法通常考虑真实框(GT box)与预测框之间的几何关系,并使用边界框的相对位置和形状来计算损失,而忽略了边界框的固有属性(如形状和尺度)对边界框回归的影响。为了弥补现有研究的不足,本文提出了一种专注于边界框本身形状和尺度的边界框回归方法。首先,我们分析了边界框的回归特性,发现边界框本身的形状和尺度因素会对回归结果产生影响。基于上述结论,我们提出了Shape IoU方法,该方法可以通过关注边界框本身的形状和尺度来计算损失,从而使边界框回归更加准确。最后,我们通过大量对比实验验证了我们的方法,实验结果表明,我们的方法可以有效提高检测性能,并优于现有方法,在不同的检测任务中都取得了最先进的性能。代码可在https://github.com/malagoutou/Shape-IoU获取。

索引术语:目标检测、损失函数和边界框回归

1、简介

目标检测是计算机视觉中的基本任务之一,其目标是在图像中定位和识别物体。根据是否生成锚点,目标检测可以分为基于锚点和无锚点的方法。基于锚点的算法包括Faster R-CNN [1]、YOLO系列(You Only Look Once) [2]、SSD(Single Shot MultiBox Detector)

猜你喜欢

转载自blog.csdn.net/m0_47867638/article/details/135435658