pandas.get_dummies(data, prefix=None, prefix_sep=’_’, dummy_na=False, columns=None, sparse=False, drop_first=False, dtype=None)
说下常用参数
data:的话就是我们要处理的数据
prefix:就是我们制定的前缀,
columns:这是我们直接在原数据集上使用
eg:
data=pd.DataFrame({'a':['x','y','z','y','x'],'b':[1,2,3,1,2]})
data
a b
0 x 1
1 y 2
2 z 3
3 y 1
4 x 2
pd.get_dummies(data,prefix='love')
b love_x love_y love_z
0 1 1 0 0
1 2 0 1 0
2 3 0 0 1
3 1 0 1 0
4 2 1 0 0
pd.get_dummies(data['b'])
1 2 3
0 1 0 0
1 0 1 0
2 0 0 1
3 1 0 0
4 0 1 0
pd.get_dummies(data,prefix='love',columns=['b'])
a love_1 love_2 love_3
0 x 1 0 0
1 y 0 1 0
2 z 0 0 1
3 y 1 0 0
4 x 0 1 0