【Python】Numpy 中的 shuffle VS permutation - 代码天地

【Python】Numpy 中的 shuffle VS permutation

其他 2018-09-22 23:28:38 阅读次数: 0

版权声明：本文为博主原创文章，未经授权禁止转载。 https://blog.csdn.net/u010099080/article/details/73395601

有时候我们会有随机打乱一个数组的需求，例如训练时随机打乱样本，我们可以使用 numpy.random.shuffle() 或者 numpy.random.permutation() 来完成。这两者非常相似，实现的功能是一样的，那么他们到底有什么区别？

本文代码及图片可以在我的GitHub 找到。

参数区别

以下 numpy.random.shuffle() 简称 shuffle，numpy.random.permutation() 简称 permutation。

shuffle 的参数只能是 array_like，而 permutation 除了 array_like 还可以是 int 类型，如果是 int 类型，那就随机打乱 numpy.arange(int)。
shuffle 返回 None，这点尤其要注意，也就是说没有返回值，而 permutation 则返回打乱后的 array。

实现区别

permutation 其实在内部实现也是调用的 shuffle，这点从 Numpy 的源码可以看出来：

def permutation(self, object x):
    '''这里都是帮助文档，我就省略了'''
    if isinstance(x, (int, long, np.integer)):
        arr = np.arange(x)
    else:
        arr = np.array(x)
    self.shuffle(arr)
    return arr

速度区别

为了测试两者的速度区别，我分别使用了 shuffle 和 permutation 对不同长度的 array 进行随机打乱并计时。

关键代码如下:

n = 10 ** np.arange(1, 10)
shuffle_elapsed = []
permutation_elapsed = []
for i in n:
    print(i)
    start = time.time()
    a = np.arange(i)
    np.random.shuffle(a)
    end = time.time()
    shuffle_elapsed.append((i, end - start))

    start = time.time()
    b = np.random.permutation(i)
    end = time.time()
    permutation_elapsed.append((i, end - start))

结果：

这里写图片描述
右键在新标签页打开查看大图

可以看出在达到 $10^9$ 级别以前，两者速度几乎没有差别，但是在达到 $10^9$ 以后两者速度差距明显拉大，shuffle 的用时明显短于 permutation。

所以在 array 很大的时候还是使用 shuffle 速度更快些，但要注意其不返回打乱后的 array，是 inplace 修改。

END

猜你喜欢

转载自blog.csdn.net/u010099080/article/details/73395601

Numpy 中的 shuffle VS permutation

【Python】Numpy 中的 shuffle VS permutation

numpy.random中的shuffle和permutation

Numpy.random中shuffle与permutation的区别

Numpy 随机序列 shuffle & permutation

Numpy关于shuffle和permutation的区别

numpy random.shuffle()和random.permutation()

shuffle数据（permutation）

shuffle与permutation的区别

Python中的shuffle（）函数的使用

python中itertools里的product和permutation

python3中shuffle函数

Python中的随机洗牌shuffle()方法

python中random模块shuffle()的用法

permutation in python

python自带的split VS numpy中的split比较

python shuffle

numpy的shuffle函数

python pandas VS numpy

np.random.shuffle与np.random.permutation的区别

np.random.shuffle和np.random.permutation区别

python3中shuffle函数要注意的地方

Python中对数组集进行按行打乱shuffle

python机器学习中random.shuffle奇技淫巧

MapReduce中shuffle过程

Hadoop中shuffle

Spark中的Shuffle过程

十二、MapReduce中的Shuffle

【numpy】np.random.shuffle()

numpy的np.random.shuffle

今日推荐

技术解析 GPT-4o：即时语音交互的突破与 GenAI 发展策略

开源大模型与闭源大模型

微信小程序授权登录获取用户的openid

亿级流量系统架构设计与实战

人工智能时代的程序设计教学与课程设计

纽交所技术问题致伯克希尔 (BRK.A) 显示跌近 100%

探索 api.maynor1024.live：一站式 AI 服务平台

AI一键去衣技术：窥见深度学习在图像处理领域的革命(最后有彩蛋)

艾体宝案例 | 使用Redis和Spring Ai构建rag应用程序

Apple M1 vs 高通8Gen2 vs Apple A12Z各方面比较

【升职加薪必备架构图】Springboot学习路线汇总_springboot四层架构流程图

与Apollo共创生态：Apollo7周年大会自动驾驶生态利剑出鞘

周排行

事务隔离级及脏读、幻读和不可重复读

rtos：zephyr同步信号量

把对象转换为JSON格式的数据

iOS Dev (56) iTunes Store 销售日报更新时间

Failed to start mongod.service: Unit not found;mongodb in unbuntu

Upgrading PHP on CentOS 6.5 (Final)

（四）王道机试指南___排版问题

TensorFlow之手写体识别

xcode xib报错 Safe Area Layout Guide Before IOS 9.0

【LeetCode】76. Minimum Window Substring（C++）

每日归档

更多

2024-06-05(0)

2024-06-04(10)

2024-06-03(52)

2024-06-02(4)

2024-06-01(60)

2024-05-31(47)

2024-05-30(4)

2024-05-29(65)

2024-05-28(2)

2024-05-27(56)