【python】pytorch中如何使用DataLoader对数据集进行批处理 - 代码天地

【python】pytorch中如何使用DataLoader对数据集进行批处理

其他 2019-01-10 21:41:47 阅读次数: 0

第一步：

我们要创建torch能够识别的数据集类型（pytorch中也有很多现成的数据集类型，以后再说）。

首先我们建立两个向量X和Y，一个作为输入的数据，一个作为正确的结果：

随后我们需要把X和Y组成一个完整的数据集，并转化为pytorch能识别的数据集类型：

我们来看一下这些数据的数据类型：

可以看出我们把X和Y通过Data.TensorDataset() 这个函数拼装成了一个数据集，数据集的类型是【TensorDataset】。

好了，第一步结束了

第二步：

就是把上一步做成的数据集放入Data.DataLoader中，可以生成一个迭代器，从而我们可以方便的进行批处理。

DataLoader中也有很多其他参数：

dataset：Dataset类型，从其中加载数据 
batch_size：int，可选。每个batch加载多少样本 
shuffle：bool，可选。为True时表示每个epoch都对数据进行洗牌 
sampler：Sampler，可选。从数据集中采样样本的方法。 
num_workers：int，可选。加载数据时使用多少子进程。默认值为0，表示在主进程中加载数据。 
collate_fn：callable，可选。 
pin_memory：bool，可选 
drop_last：bool，可选。True表示如果最后剩下不完全的batch,丢弃。False表示不丢弃。

好了，第二步结束了，

第三步：

好啦，现在我们就可以愉快的用我们上面定义好的迭代器进行训练啦。

在这里我们利用print来模拟我们的训练过程，即我们在这里对搭建好的网络进行喂入。

输出的结果是：

可以看到，我们一共训练了所有的数据训练了5次。数据中一共10组，我们设置的mini-batch是3，即每一次我们训练网络的时候喂入3组数据，到了最后一次我们只有1组数据了，比mini-batch小，我们就仅输出这一个。

此外，还可以利用python中的enumerate()，是对所有可以迭代的数据类型（含有很多东西的list等等）进行取操作的函数，用法如下：

好啦，结束。

转载自：https://www.cnblogs.com/JeasonIsCoding/p/10168753.html

猜你喜欢

转载自blog.csdn.net/zkq_1986/article/details/85249220

【python】pytorch中如何使用DataLoader对数据集进行批处理

pytorch中的dataset和DataLoader创建数据集进行训练

Pytorch对NLP的数据进行处理，使用Dataset和Dataloader方法

使用pytorch加载数据集和对数据集进行处理

用于DataLoader的pytorch数据集

Pytorch加载自己的数据集(使用DataLoader读取Dataset)

[数据处理-经济管理]如何使用Python对数据进行分组运算？

PyTorch数据处理，datasets、DataLoader及其工具的使用

[Python] PyTorch之数据集(Dataset)和数据加载器(DataLoader)介绍，使用场景和使用案例

python 使用scikit-learn对数据进行预处理

pytorch DataLoader 自定义数据集

创建用于DataLoader的pytorch数据集

[Pytorch]将自己的数据集载入dataloader

python中如何对数据进行各种排序？

python对数据进行处理分析

使用toad对数据进行分箱处理

使用Python进行FME的批处理

pytorch Dataset数据集和Dataloader迭代数据集

如何对批处理系统中的数据进行清洗和预处理？

Pytorch中的数据转换Transforms与DataLoader

pytorch中Dataloader读取数据太慢的问题

PyTorch中DataLoader与Dataset的使用、关系&原理

Pytorch中DataLoader的使用方法

使用pytorch制作自定义数据集并用DataLoader加载

pytorch进阶学习（二）：使用DataLoader读取自己的数据集

pytorch中使用Dataset和DataLoader创建自定义数据集入门

pytorch每次迭代训练前都重新对数据集进行采样形成平衡数据集

python 数据处理2----如何批量对数据进行打乱并重命名

如何对list中的数据分批处理？

Python中对数组集进行按行打乱shuffle

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)