《CenterNet: Keypoint Triplets for Object Detection》论文笔记

原文链接: https://blog.csdn.net/m_buddy/article/details/90106917
版权声明:本文为博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明。
本文链接: https://blog.csdn.net/m_buddy/article/details/90106917

代码地址:CenterNet

1. 概述

导读:这篇博客中讲到的CenterNet是由中科院、牛津大学以及华为诺亚方舟实验室联合提出的One-stag目标检测论文,该算法是在之前工作CornerNet(笔记链接:链接)的基础上进行改进得来的。主要改进的地方是使用三个“点”确定一个检测框减少误检提升检测性能。

基于关键点的目标检测算法在结果中经常会出现错误的检测框,论文中的观点是算法并没有去关注检测框的内部信息,单靠两个角点确定一个检测框自然对算法的要求很高,因而文章的作者使用三个部分去确定一个检测框:中间区域与两个角点。文章的算法源自于CornerNet,在此基础上设计了两个模块cascade corner pooling与center pooling。该算法在COCO数据集上达到了 47% 的AP。 在52层的Hourglass下270ms,104层的Hourglass下340ms(输入的图像分辨率 511 511511 511511 511 511∗511511∗511 511*511 L1损失函数用于计算三个“点”偏移。

3. 实验

3.1 网络的性能分析

文章提出的检测模型在MS-COCO数据集上与当今现有的检测方法进行对比:
在这里插入图片描述
可以说秒杀一众一阶段检测算法,只有两阶段的PANet能够抗衡(PANet的两个金字塔吃显存呀-_-||)。此外作者还将改进的算法与之前的算法进行对比(错误率):
在这里插入图片描述

3.2 网络个模块的重要性分析(消融实验)

文中提到的各个模块在检测网络中对检测性能的影响程度:
在这里插入图片描述

3.3 改进的空间

在前面的内容中提到对于中心区域的检测是通过网络学习得到的,那么直接将中心区域与GT结合不是更精准么?于是作者使用GT来替换了对中心点的预测,得到如下的结果,-_-|| 厉害了
在这里插入图片描述

                                </div>
            <link href="https://csdnimg.cn/release/phoenix/mdeditor/markdown_views-e44c3c0e64.css" rel="stylesheet">
                </div>
版权声明:本文为博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明。
本文链接: https://blog.csdn.net/m_buddy/article/details/90106917

代码地址:CenterNet

1. 概述

导读:这篇博客中讲到的CenterNet是由中科院、牛津大学以及华为诺亚方舟实验室联合提出的One-stag目标检测论文,该算法是在之前工作CornerNet(笔记链接:链接)的基础上进行改进得来的。主要改进的地方是使用三个“点”确定一个检测框减少误检提升检测性能。

基于关键点的目标检测算法在结果中经常会出现错误的检测框,论文中的观点是算法并没有去关注检测框的内部信息,单靠两个角点确定一个检测框自然对算法的要求很高,因而文章的作者使用三个部分去确定一个检测框:中间区域与两个角点。文章的算法源自于CornerNet,在此基础上设计了两个模块cascade corner pooling与center pooling。该算法在COCO数据集上达到了 47% 的AP。 在52层的Hourglass下270ms,104层的Hourglass下340ms(输入的图像分辨率 511 511511 511511 511 511∗511511∗511 511*511 L1损失函数用于计算三个“点”偏移。

3. 实验

3.1 网络的性能分析

文章提出的检测模型在MS-COCO数据集上与当今现有的检测方法进行对比:
在这里插入图片描述
可以说秒杀一众一阶段检测算法,只有两阶段的PANet能够抗衡(PANet的两个金字塔吃显存呀-_-||)。此外作者还将改进的算法与之前的算法进行对比(错误率):
在这里插入图片描述

3.2 网络个模块的重要性分析(消融实验)

文中提到的各个模块在检测网络中对检测性能的影响程度:
在这里插入图片描述

3.3 改进的空间

在前面的内容中提到对于中心区域的检测是通过网络学习得到的,那么直接将中心区域与GT结合不是更精准么?于是作者使用GT来替换了对中心点的预测,得到如下的结果,-_-|| 厉害了
在这里插入图片描述

                                </div>
            <link href="https://csdnimg.cn/release/phoenix/mdeditor/markdown_views-e44c3c0e64.css" rel="stylesheet">
                </div>

猜你喜欢

转载自blog.csdn.net/weixin_43489950/article/details/100101855