Yolo系列 v3
YOLO-V3的改进
最多的改进是网络结构,使其更适合小目标检测特征做的更细致,融入多持续特征图信息来预测不同规格物体先验框更丰富了,3种scale,每种3个规格,一共9种softmax改进,预测多标签任务
3种scale
scale变换方法
V3也采用了残差连接,堆叠更多的层来进行特征提取
核心网络架构
没有池化和全连接层,全部卷积,下采样通过stride为2实现,3种scale,更多的先验框
输入映射到输出
先验框设计
13*13特征图:(116x90),(156x198),(373x326)
26*26特征图:(30x61),(62x45),(59x119)
52*52特征图:(10x13),(16x30),(33x23)
大的先验框在感受野大的特征图中检测
softmax层替代
物体检测任务中可能一个物体有多个标签,logistic激活函数来完成,预测每个类别
logistic指的是未经过softmax函数处理的网络输出,也就是各个类别的得分(score)或概率(probability)值,因此沿用了logit这个术语。在逻辑回归(logistic regression)模型中,logits表示某个事件发生的概率与不发生的概率之比的对数值。