自定义数据集Dataset

import torch
import numpy as np
from torchvision import transforms
import torch.nn as nn
import torch.nn.functional as F


import glob  #获取路径下所有图片路径

from PIL import Image   #pyTorch中处理图片数据的模块， 根据路径打开 显示图片

2. 获取图片路径

all_img_path = glob.glob(r'E:\PYTHON学习资料2023-7-5\10深度学习\1深度学习\02TyTorch\day56_dropout和bn\代码\dataset\*.jpg')

all_img_path[:5]  #查看 获取的前五个图片路径

['E:\\PYTHON学习资料2023-7-5\\10深度学习\\1深度学习\\02TyTorch\\day56_dropout和bn\\代码\\dataset\\cloudy1.jpg',
 'E:\\PYTHON学习资料2023-7-5\\10深度学习\\1深度学习\\02TyTorch\\day56_dropout和bn\\代码\\dataset\\cloudy10.jpg',
 'E:\\PYTHON学习资料2023-7-5\\10深度学习\\1深度学习\\02TyTorch\\day56_dropout和bn\\代码\\dataset\\cloudy100.jpg',
 'E:\\PYTHON学习资料2023-7-5\\10深度学习\\1深度学习\\02TyTorch\\day56_dropout和bn\\代码\\dataset\\cloudy101.jpg',
 'E:\\PYTHON学习资料2023-7-5\\10深度学习\\1深度学习\\02TyTorch\\day56_dropout和bn\\代码\\dataset\\cloudy102.jpg']

3.建立图片类别和索引之间的映射关系

# 建立图片类别和索引之间的映射关系
species = ['cloudy', 'rain', 'shine', 'sunrise']

#建立映射关系的第一种方法
#enumerate()使可迭代的对象species列表 生成 每个元素对应的索引编号
species_to_idx = dict((c, i) for i, c in enumerate(species))

species_to_idx  #查看生成的字典映射关系

{'cloudy': 0, 'rain': 1, 'shine': 2, 'sunrise': 3}

species_to_idx.items()   #是一个可迭代的列表对象

dict_items([('cloudy', 0), ('rain', 1), ('shine', 2), ('sunrise', 3)])

# 调换一下key和value的顺序
#species_to_idx是一个字典
#从原字典species_to_idx中取出键与值，再调换位置重新组成一个新的字典
idx_to_species = dict((v, k) for k, v in species_to_idx.items())

idx_to_species  #查看调换之后的字典映射关系

{0: 'cloudy', 1: 'rain', 2: 'shine', 3: 'sunrise'}

'cloudy' in all_img_path[0]  #可判断字符串'cloudy' 是否在all_img_path[0]这张图片的路径中

True

3. 1建立图片类别的数字映射关系第二种方法：生成所有图片的label

# 生成所有图片的label 
all_labels = []

for img in all_img_path:             #遍历每一张图的路径
    for i, c in enumerate(species):  #枚举图片的每一个类别
        if c in img:                 #若字符串“类别名称” 在 遍历的这张图片路径中
            all_labels.append(i)     #将位置索引i添加到标签列表中all_labels

all_img_path[:5]   #查看 前五张 图片的路径

['E:\\PYTHON学习资料2023-7-5\\10深度学习\\1深度学习\\02TyTorch\\day56_dropout和bn\\代码\\dataset\\cloudy1.jpg',
 'E:\\PYTHON学习资料2023-7-5\\10深度学习\\1深度学习\\02TyTorch\\day56_dropout和bn\\代码\\dataset\\cloudy10.jpg',
 'E:\\PYTHON学习资料2023-7-5\\10深度学习\\1深度学习\\02TyTorch\\day56_dropout和bn\\代码\\dataset\\cloudy100.jpg',
 'E:\\PYTHON学习资料2023-7-5\\10深度学习\\1深度学习\\02TyTorch\\day56_dropout和bn\\代码\\dataset\\cloudy101.jpg',
 'E:\\PYTHON学习资料2023-7-5\\10深度学习\\1深度学习\\02TyTorch\\day56_dropout和bn\\代码\\dataset\\cloudy102.jpg']

all_labels

[0,
 0,
 0,
 0,
 0,
...
 1,
 1,
 1,
 ...
 2,
 2,
 2,
 2,
...,
3,
3,
3]

all_labels[:5]  #查看标签列表 的前五个

[0, 0, 0, 0, 0]

4.借助ndarray的索引取值的方法, 打乱数据

# 借助ndarray的索引取值的方法, 打乱数据
index = np.random.permutation(len(all_img_path))   ##生成 图片数据总量的 随机数 ，作为索

猜你喜欢

转载自blog.csdn.net/Hiweir/article/details/147062539

自定义数据集Dataset

自定义DataSet

pytorch-Dataset,DataLoader产生自定义的训练数据集

1. Keras/Tensorflow 2.0 自定义数据集 Dataset

【深度学习】自定义数据集对象mydataset |继承torch.utils.data.Dataset类

pytorch中使用Dataset和DataLoader创建自定义数据集入门

【目标检测】自定义Dataset方法(VOC数据集)——pytorch实现

深度学习项目四：创建自定义数据集的dataset, DataLoader

pytorch自定义dataset

自定义输入dataset

pytorch Dataset, DataLoader产生自定义的训练数据

PyTorch 自定义 Dataset 及训练集、测试集划分方法

pytorch DataLoader 自定义数据集

[转载]pytorch自定义数据集

pytorch: 自定义数据集加载

Keras训练自定义数据集

自定义coco数据集

HRNet 训练自定义数据集

informer自定义数据集

MMDetection训练自定义的数据集

darknet测试自定义数据集

Paddle：加载自定义数据集

Pytorch自定义Dataset和DataLoader

Pytroch数据集处理以及自定义数据集

利用torch.utils.data.Dataset自定义数据加载类

如何构建自定义人脸识别数据集

surprise库使用（二）——使用自定义数据集

【pytorch】自定义读取数据集，使用txt文本

darknet yolov3 训练自定义数据集

maskrcnn benchmark自定义数据集的方法

今日推荐

deepseek热度已过？

MOOC习题:“GPS数据处理”题目个人解析(C语言)

DeepSeek接入微信公众号小白保姆教程

图+语义：RDF语义处理组件Neosemantics功能列表

大语言模型Prompt工程之使用GPT4生成图数据库Cypher

大语言模型Prompt工程之使用GPT3.5生成图数据库Cypher

GPT-3.5 生成 Fabric Cypher

生成 Cypher 能力：GPT3.5 VS ChatGLM

LangChain 2 ONgDB：大模型+知识图谱实现领域知识问答

生成 Cypher 能力：MOSS VS ChatGLM

Neo4j/ONgDB 图数据库快速处理 Excel 文件

LangChain-Agents 入门指南

周排行

blog公告

Lucene：基本增删改查（Java方式）

1、类库

android环信集成单聊功能

删除数据库表数据SQL语句

rhel6.3安装Percona XtraDB Cluster 5.7时错误的解决方法

天梯赛-堆栈（线段树）

ES6原生Class

20120607

张正友标定算法原理详解

每日归档

2025-04-11(9561)

2025-04-10(1213)

2025-04-09(10354)

2025-04-08(12998)

2025-04-07(0)

2025-04-06(0)

2025-04-05(0)

2025-04-04(0)

2025-04-03(0)

2025-04-02(0)