LabelBinarizer 函数与独热编码 - 代码天地

LabelBinarizer 函数与独热编码

其他 2020-01-28 09:47:17 阅读次数: 0

数据处理时有时需要将离散特征进行独热编码或者哑变量编码。两者的区别如下所示
在这里插入图片描述
上述图片引用自 https://www.cnblogs.com/lianyingteng/p/7792693.html
两者区别似乎不是很大。

LabelBinarizer 将标签矩阵二值化

from sklearn import preprocessing
from sklearn import tree

# help(preprocessing.LabelBinarizer)#取消注释可以查看详细用法

# 特征矩阵
featureList=[[1,0],[1,1],[0,0],[0,1]]
# 标签矩阵
labelList=['yes', 'no', 'no', 'yes']
labelList1=['yes', 'no', 'no', 'yes','three']
# 将标签矩阵二值化
lb = preprocessing.LabelBinarizer()
dummY=lb.fit_transform(labelList)
dummY1=lb.fit_transform(labelList1)
print(dummY)
print(dummY1)

结果如下所示，当标签仅有yes no两种时，labelBinarizer将之转换为1，0的矩阵，而当标签存在多种时，其结果类似于上面说的独热编码在这里插入图片描述

#pd中的get_dummies 是利用pandas实现one hot encode的方式,将数据转换为矩阵形式

另一个例子

from sklearn.preprocessing import label_binarize
print(Y_test[0:15])
y_test_hot = label_binarize(Y_test,classes=(1,2,3))
print(y_test_hot[0:5])
print(y_test_hot.ravel()[0:15])

在这里插入图片描述

发布了23 篇原创文章 · 获赞 6 · 访问量 4677

私信关注

猜你喜欢

转载自blog.csdn.net/qq_34211618/article/details/103840113

LabelBinarizer 函数与独热编码

sklearn中的几种二值化编码函数：OneHotEncoder, LabelEncoder , LabelBinarizer

独热编码函数

sklearn.preprocessing.LabelBinarizer

标签二值化LabelBinarizer

独热编码

快速独热编码

Python独热编码get_dummies函数

实现独热编码的方法

独热向量编码原理

sklearn preprocessing 独热编码

Python实现独热编码

关联规则&&独热编码

sklearn 处理文本和分类属性[LabelBinarizer, LabelEncoder,OneHotEncoder]

python编程之sklearn.preprocessing.LabelBinarizer()的用法解析

one-hot编码（独热编码）

独热编码 one-hot Encoding

数据预处理—独热编码

机器学习之独热编码

One-Hot Encoding独热编码

One-Hot Encoding 独热编码

独热编码（One-Hot）的理解

数据预批处理-独热编码

独热编码处理文本属性

pandas中独热编码的使用（理论）

独热编码（One-Hot Encoding）

数据预处理-onehot独热编码

one-hot编码/哑编码/独热编码

OneHotEncoder独热编码和 LabelEncoder标签编码

独热编码(one-hot encoding)与哑编码

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

周排行

Metasploit文件目录与入侵基本概念

跨域(CORS)请求问题[No 'Access-Control-Allow-Origin' header is present on the requested resource]常见解决方案

CodeIgniter 源码解读之 CodeIgniter.php（二）

SAS入门之（四）改变数据类型

初识元组

[数学建模]数学建模算法和模型（B站视频）（二）

Nginx 服务器源码安装配置流程

C#实现语音视频录制【基于MCapture + MFile】

开发进度4

下载安装vue的方法网址

每日归档

更多

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)