sklearn字典特征提取

其他 2021-10-08 23:48:52 阅读次数: 0

作用：对字典数据进行特征值化

sklearn.feature_extraction.DictVectorizer(sparse=True,…)
- DictVectorizer.fit_transform(X) X:字典或者包含字典的迭代器返回值：返回sparse矩阵
- DictVectorizer.inverse_transform(X) X:array数组或者sparse矩阵返回值:转换之前数据格式
- DictVectorizer.get_feature_names() 返回类别名称

我们对以下数据进行特征提取

[{
    
    'city': '北京','temperature':100}, 
{
    
    'city': '上海','temperature':60}, 
{
    
    'city': '深圳','temperature':30}]

def dict_demo():
    """
    字典特征值提取
    :return:
    """
    data = [{
    
    'city': '北京', 'temperature': 100}, {
    
    'city': '上海', 'temperature': 60}, {
    
    'city': '深圳', 'temperature': 30}]
    # 1. 实例化一个转换器   默认返回 sparse矩阵  将非0值按位置表示出来 以节省内存 提高加载效率
    transfer = DictVectorizer(sparse=False)

    # 应用场景：数据集中类别特征值较多；将数据集的特征-》字典类型；DictVectorizer转换；本身拿到的就是字典

    # 2. 调用fit_transform()
    data_new = transfer.fit_transform(data)
    print("data_new:\n", data_new)
    print("特征名字:\n", transfer.get_feature_names())
    return None

在这里插入图片描述
对于特征当中存在类别信息的我们都会做one-hot编码处理

猜你喜欢

转载自blog.csdn.net/weixin_43874301/article/details/119270205

sklearn字典特征提取

sklearn 特征提取

特征提取—文本，字典特征提取

sklearn中的特征提取（important）

机器学习之sklearn特征提取

基于sklearn的文本特征提取与分类

sklearn数据集特征提取操作

字典特征提取DictVectorizer（特征工程之特征提取）

特征工程-特征提取：字典特征提取、文本特征提取、jieba分词处理、Tf-idf文本特征提取

机器学习-特征工程-字典特征提取

字典特征提取和文本特征抽取

【机器学习】特征工程 - 字典特征提取

【sklearn第五讲】特征提取（上）

【sklearn第六讲】特征提取（下）

PCA特征提取及使用sklearn降维方法

TF-IDF特征提取用sklearn提取tfidf特征

机器学习之路：python 字典特征提取器 DictVectorizer

SIFT特征提取

特征提取总结

surf特征提取

mfcc特征提取

图像特征提取

opencv 特征提取

特征提取-MFCC

信号特征提取

文本特征提取

图像的特征提取

LBP特征提取

特征提取

OpenCV特征提取

今日推荐

Electron中的关于静态资源加载问题解决方案

《Cursor-AI编程》基础篇-界面指南

《Cursor-AI编程》基础篇-Tab代码智能补充

《Cursor-AI编程》基础篇-Composer功能详解

《Cursor-AI编程》基础篇-Chat功能详解

《Cursor-AI编程》进阶篇-自定义模型

《Cursor-AI编程》进阶篇-上下文详解

【大模型系列篇】最强检索增强技术GraphRAG基本原理详解

【大模型系列篇】基于Ollama和GraphRAG v2.0.0快速构建知识图谱

解释什么是迁移学习？在 CNN 中如何应用？（面试题200合集，高频、关键）

解释数据增强（Data Augmentation）的概念和方法（（面试题200合集，高频、关键））

揭秘大模型“魔法”：Function Calling 让 AI 不止会说，更能“做”！

周排行

集成学习——LightGBM原理理解

java复制pdf并且往pdf文件中添加内容

DRF的解析器和渲染器 DRF的解析器和渲染器

pytest以函数形式的测试用例

CSS3 边框

C语言编程经典案例，三种方法求水仙花数（附完整代码）

算法题（313）

css如何让背景透明，文字不透明

linux下网络程序遭遇SIGPIPE的解决（转）

用xposed Hook框架Hook 安卓apk的按钮Id

每日归档

更多

2025-04-13(999)

2025-04-12(10529)

2025-04-11(9561)

2025-04-10(1213)

2025-04-09(10354)

2025-04-08(12998)

2025-04-07(0)

2025-04-06(0)

2025-04-05(0)

2025-04-04(0)