pandas的get_dummies进行one-hot编码

pandas.get_dummies(data, prefix=None, prefix_sep=’_’, dummy_na=False, columns=None, sparse=False, drop_first=False, dtype=None)
说下常用参数
data:的话就是我们要处理的数据
prefix:就是我们制定的前缀,
columns:这是我们直接在原数据集上使用

eg:

data=pd.DataFrame({'a':['x','y','z','y','x'],'b':[1,2,3,1,2]})
data
   a  b
0  x  1
1  y  2
2  z  3
3  y  1
4  x  2

pd.get_dummies(data,prefix='love')
   b  love_x  love_y  love_z
0  1       1       0       0
1  2       0       1       0
2  3       0       0       1
3  1       0       1       0
4  2       1       0       0

pd.get_dummies(data['b'])
   1  2  3
0  1  0  0
1  0  1  0
2  0  0  1
3  1  0  0
4  0  1  0

pd.get_dummies(data,prefix='love',columns=['b'])
   a  love_1  love_2  love_3
0  x       1       0       0
1  y       0       1       0
2  z       0       0       1
3  y       1       0       0
4  x       0       1       0

猜你喜欢

转载自blog.csdn.net/starmoth/article/details/84454883