Anchor free系列检测器之YOLOX源码逐行讲解篇(五)--mosaic数据增强及数学理解

整个YOLOX源码的学习一定要按照以下顺序才能整体串起来:Backbone->FPN->Head->->数据读入源码->数据增强源码->loss计算源码->simOTA源码->demo.py脚本->train.py脚本。而该系列博文也遵循该顺序来逐行分析代码。注意是逐行,包括python语法,tensor维度和逐行代码的作用及应用。其实网络结构本没有任何神秘的地方,都是一些模块堆叠起来的,你完全可以没有任何理由的修改任何一个模块。看完这个系列后自己完全可以随便的去对任何网络结构做手脚,而不仅仅局限于一个调参者。

本篇讲的是YOLOX中的mosaic数据增强,大多还是opencv的操作。


下图就是一个mosaic增强后的效果图,可以看出:该图像由四张图像拼接且每张图像都有一定的仿射变换(旋转、平移、resize等)

我们打开yolox\data\datasets\mosaicdetection.py,从下图所示的地方开始:

猜你喜欢

转载自blog.csdn.net/qq_42308217/article/details/122921871