Bag of Tricks and A Strong Baseline for Deep Person Re-identification

相当于是一种强力有效的训练Re-ID的方式,基于全局特征,不需要多分支网络。

主要训练如下:

  1. 我们使用ImageNet下训练的参数来初始化ResNet50,将全连接参数改为N。N表示训练数据集中目标的个数。

  2. 我们随机抽取P个对象,每个对象K张图来构成训练batch。最终的Batchsize为B=P×K。本文中,我们设置P=16,K=4。

  3. 将每张样本resize成256×128像素大小,并pad10个像素0。随机crop成256×128矩形样本。

  4. 样本以0.5的概率进行随机翻转。

  5. 样本为值域范围为【0,1】之间的32位浮点数。RGB通道减去均值0.485,0.456,0.406,并分别处以0.229,0.224,0.225。

  6. 模型输出ReID特征f与ID预测值logp。 ReID特征f用于计算triplet loss。ID预测值logp

  7. 用于计算交叉熵损失函数。Triplet loss的权重设置为0.3。

  8. Adam用于进行模型优化。初始化学习权重设置为0.00035并分别在第40次与70次epoch时下降0.1。整体训练120个epochs。

Big Tricks:

  1. 实际上是在特征层或者是全连接层后面增加了BN层,文章也详细的说明了正则化对整体特征约束的优点。
  2. 使用了Center Loss,效果好于Triple Loss和ID Loss的联合
  3. 对数据使用随机擦除数据增强,提高模型的泛化能力
  4. 调整后学习率
  5. 使用平滑标签

最后试验表明,在Market-1501上rank1高达94%以上。

猜你喜欢

转载自blog.csdn.net/weixin_36411839/article/details/104292304