Scikit-learn数据预处理分类变量编码之字段特征编码

其他 2021-01-30 01:23:14 阅读次数: 0

Scikit-learn数据预处理分类变量编码之字段特征编码

1 声明

本文的数据来自网络，部分代码也有所参照，这里做了注释和延伸，旨在技术交流，如有冒犯之处请联系博主及时处理。

2 字段特征编码简介

字典特征编码主要是对字典类型的数据进行编码，取key为列，value则对应列的值。比如NLP里的词频,key为单词、values为单词出现次数。

注：这里主要针对原始分类变量是字符串的情况。

from sklearn.feature_extraction import DictVectorizer
data_dict = [{"NLP": 2, "Deep Learning": 4},
{"Nosql": 4, "Machine learning ": 3},
{"Nosql": 1, "Deep Learning": 2},
{"NLP": 2, "Machine learning": 2}]
dictvectorizer = DictVectorizer(sparse=False)
features = dictvectorizer.fit_transform(data_dict)
print(features)
print(dictvectorizer.feature_names_)

猜你喜欢

转载自blog.csdn.net/shenliang1985/article/details/112579633

Scikit-learn数据预处理分类变量编码之字段特征编码

Scikit-learn数据预处理分类变量编码之等级变量编码

Scikit-learn数据预处理分类变量编码之标签二值化

Scikit-learn数据预处理分类变量编码之多标签二值化

Scikit-learn数据预处理之范数缩放NormalizerScaler

scikit-learn数据预处理

数据预处理（Python scikit-learn）

数据预处理 Scikit-learn Preprocessing

scikit-learn与数据预处理

机器学习 scikit-learn 特征预处理

python 使用scikit-learn对数据进行预处理

Scikit-learn 数据预处理之鲁棒缩放RobustScaler

Scikit-learn 数据预处理之标准化StandardScaler

Scikit-learn 数据预处理之归一化MinMaxScaler

Scikit-learn Preprocessing 预处理

使用scikit-learn进行预处理

这3个Scikit-learn的特征选择技术，能够有效的提高你的数据预处理能力

python 图像预处理 Scikit-learn Preprocessing 预处理

数据的特征工程之Scikit-learn

[scikit-learn] 特征二值化编码函数的一些坑

机器学习之数据预处理——特征编码(标签编码，独热编码)

Python scikit-learn，数据的预处理，缺失值处理，Imputer

scikit-learn 新增功能：标签编码、决策树缺失值处理等众多新特性

【Scikit-Learn 中文文档】预处理数据 - 数据集转换 - 用户指南 | ApacheCN

scikit-learn数据预处理fit_transform()与transform()的区别

Python scikit-learn，数据的预处理，标准化，StandardScaler

Python scikit-learn，数据的预处理，归一化，MinMaxScaler

Scikit-learn 数据预处理之最大绝对值MaxAbsScaler

机械学习 - 基础概念 - scikit-learn - 数据预处理 - 1

Scikit-learn与特征工程

今日推荐

周排行

unity 内存管理**标记实时更新

微信返回时页面很卡或者页面跳转有问题

正则介绍以及grep

(转)editText圆角边框

模块化物料清单

js去掉数组中重复的元素

小程序Promise不支持finally解决方案

输入一颗二叉树的根节点，求二叉树的深度

POJ 2800:垂直直方图

Firefox 71 发布，具有画中画支持及更多功能

每日归档

更多

2025-02-05(0)

2025-02-04(0)

2025-02-03(0)

2025-02-02(0)

2025-02-01(0)

2025-01-31(0)

2025-01-30(0)

2025-01-29(0)

2025-01-28(0)

2025-01-27(0)