卷积神经网络—目标检测 学习笔记(下)

3.7 非极大值抑制(Non-max suppresion)

非极大值抑制,即只保留极大值(概率最大的预测结果)。
之前介绍的YOLO还存在的一个问题:同一个目标可能出现多个预测结果。如下图所示:
NMS

confidence

对于右边的汽车,会有三个网格认为中点落在了自己中,因而在显示结果时会出现三个预测边界框,这显然是不正确。通过使用非极大值抑制可以较好地解决该问题。
算法如下:
algorithm
经过非极大值抑制后结果如下图:
result
注意:如果有多个分类,则需要对每个分类跑一次非极大值抑制。

3.8 Anchor Boxes

之前介绍的YOLO无法处理一个网格中存在多个目标的问题。为了改进YOLO,引入了anchor boxes的概念。
与之前一个网格对应一个结果不同,引入anchor boxes的YOLO每个网格对应多个anchor boxes,每个anchor boxes对应一个结果,相应的Y也发生了变化,具体见下图:
anchor boxes

上图中女人和车的中点落在了同一个网格中,但是依据形状分配给了anchor box1和anchor box2。相应的,Y也由左边的8维变成了16维(因为有两种anchor boxes)
具体算法描述见下:
algorithm

猜你喜欢

转载自blog.csdn.net/guojunxiu/article/details/79247598
今日推荐