深度学习:Yolo系列 v3

Yolo系列 v3

YOLO-V3的改进

最多的改进是网络结构,使其更适合小目标检测特征做的更细致,融入多持续特征图信息来预测不同规格物体先验框更丰富了,3种scale,每种3个规格,一共9种softmax改进,预测多标签任务

3种scale

scale变换方法

V3也采用了残差连接,堆叠更多的层来进行特征提取

核心网络架构

没有池化和全连接层,全部卷积,下采样通过stride为2实现,3种scale,更多的先验框

输入映射到输出

先验框设计

13*13特征图:(116x90),(156x198),(373x326)

26*26特征图:(30x61),(62x45),(59x119)

52*52特征图:(10x13),(16x30),(33x23)

大的先验框在感受野大的特征图中检测

softmax层替代

物体检测任务中可能一个物体有多个标签,logistic激活函数来完成,预测每个类别

logistic指的是未经过softmax函数处理的网络输出,也就是各个类别的得分(score)或概率(probability)值,因此沿用了logit这个术语。在逻辑回归(logistic regression)模型中,logits表示某个事件发生的概率与不发生的概率之比的对数值。

猜你喜欢

转载自blog.csdn.net/mohanyelong/article/details/143184176