14、PyTorch教程---数据集

在本章中,我们将更加专注于torchvision.datasets及其各种类型。PyTorch包括以下数据集加载器:

MNIST
COCO(字幕和检测)
数据集包括以下两种类型的主要功能:

Transform - 一个接受图像并返回标准内容的修改版本的函数。这些可以与transforms组合在一起。

Target_transform - 一个接受目标并对其进行变换的函数。例如,接受字幕字符串并返回世界索引的张量。

MNIST
以下是MNIST数据集的示例代码:

dset.MNIST(root, train=True, transform=None, target_transform=None, download=False)

参数如下:

root - 数据集的根目录,其中包含已处理的数据。

train - True表示训练集,False表示测试集。

download - True表示从互联网下载数据集并将其放入根目录。

COCO
这需要安装COCO API。以下示例用于演示使用PyTorch实现的COCO数据集:

import torchvision.datasets as dset
import torchvision.transforms as transforms

cap = dset.CocoCaptions(root='图像所在目录', annFile='json注释文件', transform=transforms.ToTensor())
print('样本数量:', len(cap))
print(target)

输出如下:

样本数量:82783
图像尺寸:(3L, 427L, 640L)

猜你喜欢

转载自blog.csdn.net/Knowledgebase/article/details/133311433