Pytorch使用shuffle打乱数据 - 代码天地

Pytorch使用shuffle打乱数据

企业开发 2022-06-06 05:16:29 阅读次数: 0

这个东西算是我被这个shuffle坑了的一个总结吧！
首先我得告诉你一件事，那就是pytorch中的tensor，如果直接使用random.shuffle打乱数据，或者使用下面的方式，自己定义直接写。

 def Shuffle(self, x, y,random=None, int=int):
         if random is None:
            random = self.random
                 for i in range(len(x)):
            j = int(random() * (i + 1))
            if j<=len(x)-1:
                x[i],x[j]=x[j],x[i]
                y[i],y[j]=y[j],y[i]
          retrun x,y

那你就会收获一堆的混乱数据，因为使用这种交换的方式对tensor类型的数据进行操作，会导致里面的数据出现重复复制的问题。
比如我y中的数据为【0,1,0，1,0，1】
在经过几次shuffle,其中的数据就变成了【1,1,1,1,1,1】。
数据顿时出现混乱。
正确的方式是先转成numpy，再进行交换数据。
比如：

 def Shuffle(self, x, y,random=None, int=int):
        """x, random=random.random -> shuffle list x in place; return None.

        Optional arg random is a 0-argument function returning a random
        float in [0.0, 1.0); by default, the standard random.random.
        """

        if random is None:
            random = self.random #random=random.random
        #转成numpy
        if torch.is_tensor(x)==True:
            if self.use_cuda==True:
               x=x.cpu().numpy()
            else:
               x=x.numpy()
        if torch.is_tensor(y) == True:
            if self.use_cuda==True:
               y=y.cpu().numpy()
            else:
               y=y.numpy()
        #开始随机置换
        for i in range(len(x)):
            j = int(random() * (i + 1))
            if j<=len(x)-1:#交换
                x[i],x[j]=x[j],x[i]
                y[i],y[j]=y[j],y[i]

        #转回tensor
        if self.use_cuda == True:
            x=torch.from_numpy(x).cuda()
            y=torch.from_numpy(y).cuda()

        else:
            x = torch.from_numpy(x)
            y = torch.from_numpy(y)
        return x,y

猜你喜欢

转载自blog.csdn.net/qq_41487299/article/details/107424432

Pytorch使用shuffle打乱数据

简化SQL计算之打乱数据列次序（Shuffle）

pandas打乱数据

打乱数据

Pytorch 按某个维度打乱数据方法（转载）

javascript随机打乱数组shuffle

Collections.shuffle() 随机打乱数组

PHP shuffle() 函数（打乱数组）

Python 训练模型前数据预处理：shuffle - 打乱数据

leetcode-384-打乱数组(shuffle an array)-java

random.shuffle()随机打乱数组顺序

打乱数组内数据顺序

numpy利用下标打乱数据集

pandas dataframe 如何打乱数据

python 打乱数据集和标签

LeetCode初级算法--设计问题01：Shuffle an Array （打乱数组）

php数组随机排序函数 shuffle()随机打乱数组元素的顺序

打乱数组

随机打乱数组

143、打乱数组

【数组】打乱数组

打乱数组排序

随机打乱数据框DataFrame中行的顺序

Python 训练神经网络打乱数据集

【深度学习】打乱数据及keras自定义generator

机器学习中打乱数据集有什么作用

Sort()函数使用+如何打乱数组（洗牌算法）

Python 使用 shuffle() 乱序排列/打乱序列/打乱列表

random.shuffle打乱list使用

python 利用numpy同时打乱列表的顺序，同时打乱数据和标签的顺序

今日推荐

Electron中的关于静态资源加载问题解决方案

《Cursor-AI编程》基础篇-界面指南

《Cursor-AI编程》基础篇-Tab代码智能补充

《Cursor-AI编程》基础篇-Composer功能详解

《Cursor-AI编程》基础篇-Chat功能详解

《Cursor-AI编程》进阶篇-自定义模型

《Cursor-AI编程》进阶篇-上下文详解

【大模型系列篇】最强检索增强技术GraphRAG基本原理详解

【大模型系列篇】基于Ollama和GraphRAG v2.0.0快速构建知识图谱

解释什么是迁移学习？在 CNN 中如何应用？（面试题200合集，高频、关键）

解释数据增强（Data Augmentation）的概念和方法（（面试题200合集，高频、关键））

揭秘大模型“魔法”：Function Calling 让 AI 不止会说，更能“做”！

周排行

ConfigurationClassParser类的parse方法源码解析

基础大讲堂-java 位运算符

ConsecutiveInteger判断给定的整数n能否表示成连续的m(m>1)个正整数之和

多项式问题之六——多项式快速幂

Spring Security技术栈开发企业级认证与授权（四）RESTful API服务异常处理

Linux基础命令---apachectl

MATLAB中的线性插值

Unity编辑器拓展之十七：NGUI ComponentSelector增加搜索框

SqlServer 备份还原教程

[Unity动画]01.

每日归档

更多

2025-04-12(10529)

2025-04-11(9561)

2025-04-10(1213)

2025-04-09(10354)

2025-04-08(12998)

2025-04-07(0)

2025-04-06(0)

2025-04-05(0)

2025-04-04(0)

2025-04-03(0)