Python中使用pandas.get_dummies()生成one-hot编码标签

one-hot编码是监督学习中经常对标签处理的一种方式。


假设我们有一组标签:

import numpy as np
import pandas as pd

labels = np.array(['Cat', 'Dog', 'Dog', 'Cat', 'Bird', 'Fish'])
print("Labels shape: %d" % labels.shape)
print("Labels:", labels)

我们可以利用pandas.get_dummies()生成one-hot型式:

print(pd.get_dummies(labels))
one_hot = np.asarray(pd.get_dummies(labels))
print("One-hot Labels shape:", one_hot.shape)
print("One-hot Labels:", '\n', one_hot)

猜你喜欢

转载自blog.csdn.net/kane7csdn/article/details/84294863