Anchor free系列检测器之YOLOX源码逐行讲解篇(六)--Mixup数据增强

整个YOLOX源码的学习一定要按照以下顺序才能整体串起来:Backbone->FPN->Head->->数据读入源码->数据增强源码->loss计算源码->simOTA源码->demo.py脚本->train.py脚本。而该系列博文也遵循该顺序来逐行分析代码。注意是逐行,包括python语法,tensor维度和逐行代码的作用及应用。其实网络结构本没有任何神秘的地方,都是一些模块堆叠起来的,你完全可以没有任何理由的修改任何一个模块。看完这个系列后自己完全可以随便的去对任何网络结构做手脚,而不仅仅局限于一个调参者。

本篇讲的是YOLOX中的mixup数据增强。其过程就是将两张图缩放,翻转或mosaic数据增强后按一定比例混合,同时将gtbox进行混合。代码只有六七十行,是这个系列最简单的一节。


将YOLOX中mixup增强的代码定位到yolox\data\datasets\mosaicdetection.py的mixup()方法,该方法中,origin_img参数代表mosaic增强后的图像,origin_labels参数代表mosaic增强后的标签,input_dim参数代表预设的输入尺寸,如(640, 640)。

猜你喜欢

转载自blog.csdn.net/qq_42308217/article/details/122931685