torchvision是PyTorch的一个视觉工具包,提供了很多图像处理的工具。
datasets使用ImageFolder工具,获取定制化的图片并自动生成类别标签。如裁剪、旋转、标准化、归一化等。
DataLoader可以把datasets数据集打乱,分成batch,并行加速等。
一、获取图片及命名标签
使用torchvision.datasets中的ImageFolder工具,功能:
1、文件夹名就是类别名
2、从上到下自动为文件夹创建标签,0、1、2、...。class_to_idx、imgs属性可以查看。
3、返回每一幅图的data、label
from torchvision.datasets import ImageFolder dataset=ImageFolder("E:/data/dogcat_2/train/") #获取路径,返回的是所有图的data、label print(dataset.class_to_idx) #查看类别名,及对应的标签。 print(dataset.imgs) #查看路径里所有的图片,及对应的标签
print(dataset[0][1]) #第1张图的label dataset[0][0] #第1张图的data
二、