DIoU YOLOv3 | AAAI 2020：更加稳定有效的目标框回归损失 - 代码天地

DIoU YOLOv3 | AAAI 2020：更加稳定有效的目标框回归损失

其他 2020-02-24 23:15:31 阅读次数: 0

DIoU要比GIou更加符合目标框回归的机制，将目标与anchor之间的距离，重叠率以及尺度都考虑进去，使得目标框回归变得更加稳定，不会像IoU和GIoU一样出现训练过程中发散等问题。
https://arxiv.org/pdf/1911.08287.pdf
https://github.com/Zzh-tju/DIoU-darknet

1：IoU & GIoU存在的问题分析

论文作者通过一个仿真实现，从实验结果的角度说明了IoU和GIoU存在的问题。实验设定如下图所示，
一：绿色框代表仿真实验需要回归的七个不同尺度的目标框，七个目标框的中心点坐标都是（10 * 10）。
二：蓝色的点代表了所有anchor的中心点，中心点的分布如下图所示，各个方向都有，各种距离都有，当然每个anchor得一个中心点都包含有七个不同面积的anchor框。而且每个面积的anchor框又有其中不用比例尺寸。因此一共有5000个蓝色点，有5000*7*7个anchor框，而且每个框都需要回归到七个目标框去，因此一共有5000*7*7*7个回归案例。

最终的实验结果如下：图中展示的训练同样的代数后（200代），三个loss最终每个anchor的误差分布。
一：IoU：从IoU误差的曲线我们可以发现，anchor越靠近边缘，误差越大，那些与目标框没有重叠的anchor基本无法回归。
二：GIoU：从GIoU误差的曲线我们可以发现，对于一些没有重叠的anchor，GIoU的表现要比IoU更好。但是由于GIoU仍然严重的依赖IoU，因此在两个垂直方向，误差很大，基本很难收敛，这就是GIoU不稳定的原因。
三：DIoU：从DIoU误差的曲线我们可以发现，对于不同距离，方向，面积和比例的anchor，DIoU都能做到较好的回归。

再用一张很形象的图，来说明GIoU不稳定以及收敛很慢的原因。下图中第一行三张图展示的是GIoU的回归过程，其中绿色框为目标框，黑色框为anchor，蓝色框为不同次数的迭代后，anchor的偏移结果。第二行三张图展示的是DIoU的回归过程，其中绿色框为目标框，黑色框为anchor，红色框为不同次数的迭代后，anchor的偏移结果。从图中我们可以看到，GIoU在回归的过程中，从损失函数的形式我们发现，当IoU为0时，GIoU会先尽可能让anchor能够和目标框产生重叠，之后GIoU会渐渐退化成IoU回归策略，因此整个过程会非常缓慢而且存在发散的风险。而DIoU考虑到anchor和目标之间的中心点距离，可以更快更有效更稳定的进行回归。

2：提出问题

基于GIoU存在的问题，作者提出了两个问题：
首先，直接最小化anchor框与目标框之间的归一化距离是否可行，以达到更快的收敛速度。
其次，如何使回归在与目标框有重叠甚至包含时更准确、更快。

3：DIoU

作者为了回答第一个问题：提出了Distance-IoU Loss

上述损失函数中，b，bgt分别代表了anchor框和目标框的中心点，且p代表的是计算两个中心点间的欧式距离。c代表的是能够同时覆盖anchor和目标框的最小矩形的对角线距离。因此DIoU中对anchor框和目标框之间的归一化距离进行了建模。直观的展示如下图所示。

DIoU的优点如下：
1.与GIoU loss类似，DIoU loss在与目标框不重叠时，仍然可以为边界框提供移动方向。
2.DIoU loss可以直接最小化两个目标框的距离，因此比GIoU loss收敛快得多。
3.对于包含两个框在水平方向和垂直方向上这种情况，DIoU损失可以使回归非常快，而GIoU损失几乎退化为IoU损失。

3：CIoU

作者为了回答第二个问题：提出了Complete-IoU Loss
一个好的目标框回归损失应该考虑三个重要的几何因素：重叠面积、中心点距离、长宽比。
GIoU：为了归一化坐标尺度，利用IoU，并初步解决IoU为零的情况。
DIoU：DIoU损失同时考虑了边界框的重叠面积和中心点距离。
然而，anchor框和目标框之间的长宽比的一致性也是极其重要的。基于此，作者提出了Complete-IoU Loss。

上述损失函数中，CIoU比DIoU多出了阿尔法和v这两个参数。其中阿尔法是用于平衡比例的参数。v用来衡量anchor框和目标框之间的比例一致性。

从阿尔法参数的定义可以看出，损失函数会更加倾向于往重叠区域增多方向优化，尤其是IoU为零的时候。

4：DIoU & CIoU结果分析

yuanCruise 博客专家

发布了233 篇原创文章 · 获赞 187 · 访问量 40万+

他的留言板关注

猜你喜欢

转载自blog.csdn.net/qiu931110/article/details/103330107

DIoU YOLOv3 | AAAI 2020：更加稳定有效的目标框回归损失

AAAI 2020 | DIoU和CIoU：IoU在目标检测中的正确打开方式

YOLOv3损失函数

【yolov3损失函数】

YoloV3目标检测

目标检测：YOLOV3

DIOU

【目标检测算法】IOU、GIOU、DIOU、CIOU与YOLOv5损失函数

Yolov3的损失函数分析

YOLOv5改进 | 损失函数篇 | EIoU、SIoU、WIoU、DIoU、FocusIoU等二十余种损失函数

目标检测：YOLOV3论文解读

目标检测网络之 YOLOv3

目标检测之YOLOv3

目标检测——YOLOV3的学习笔记

目标检测——YOLOv3（六）

【目标检测】YOLOV3详解

目标检测学习--yolov3

YOLOv3计算mAP教程（简单有效）

AAAI 2020 论文

IOU，GIOU，DIOU，CIOU损失函数的对比

损失函数DIOU的计算方法

（六）论文阅读 | 目标检测之DIoU

目标检测 IoU、GIoU、DIoU、CIoU、EIoU

基于caffe框架复现yolov3目标检测

基于OpenCV和YOLOv3深度学习的目标检测

opencv调用YOLOv3模型进行目标检测

目标检测（七）YOLOv3: An Incremental Improvement

目标检测 | YOLOv3训练自己的数据全流程

全套的目标检测：YOLOv3: 训练自己的数据

基于 YOLOV3 和 OpenCV的目标检测

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)