random.shuffle和numpy.random.shuffle

两者用法基本上一致,都是随机打乱数据。代码如下:

# random shuffle
import random
a = [1,2,3,4]
b = [[5,6,7,8], [9,10,11,12]]
random.shuffle(a)
random.shuffle(b)

#结果如下:
[3, 4, 1, 2]
[[5, 6, 7, 8], [9, 10, 11, 12]]

注:random.shuffle是对list进行随机打乱

import numpy as np
a = np.array([1,2,3,4])
b = np.array([[5,6,7,8], [9,10,11,12]])
np.random.shuffle(a)
np.random.shuffle(b)

#结果如下: 
array([3, 1, 4, 2])
array([[ 9, 10, 11, 12],
       [ 5,  6,  7,  8]])

我在做分类时需要打乱数据,本身数据是numpy格式,而我用的是random.shuffle每轮打乱的数据,训练集和测试集准确度很快就达到100%,原因如下:

import random
b = np.array([[5,6,7,8], [9,10,11,12],[20,21,24,25],[30,31,34,45]])

# 随机打乱十次
for _ in range(10):
    random.shuffle(b)
b 

#结果显示,数组所有元素都是b[0]的值
array([[5, 6, 7, 8],
       [5, 6, 7, 8],
       [5, 6, 7, 8],
       [5, 6, 7, 8]])

在我每轮随机打乱顺序后,所有的数据都是一样的,所以准确度很快达到了100%,数据格式需要对应同样格式的操作啊!!!

猜你喜欢

转载自blog.csdn.net/qq_44846512/article/details/112187934
今日推荐