dataloader的目的是将dataset这个类返回的image和标签的tensor进行打包,具体一个step传入多少个图片和标签是由batchsize决定的,而dataloader负责将返回的图片和标签的tensor进行打包放入trainer进行训练。
而dataloader对tensor进行打包的前提就是tensor的大小必须是一样的,如果不一样就会报错。因此在传入图片时必须先对图片进行处理,将图片尺寸调整到指定范围。
YOLO一般是对图片进行裁剪或填充,当然也可以对tensor进行操作。