机器学习知识点查漏补缺（特征工程） - 代码天地

机器学习知识点查漏补缺（特征工程）

其他 2018-04-14 21:22:23 阅读次数: 3

一、特征工程

数据决定了机器学习的上限，而算法只是尽可能逼近这个上限。如果输入的数据本身不反应客观事实，再牛逼的算法也无能为力。所以需要对输入数据（特征）有一个采集、整理、选择的过程，让算法模型更好的识别到客观事实的规律所在。

一般来说，特征工程大体上可以分为三个方面，一是特征构造，二是特征生成，三是特征选择。

二、特征构造

特征构造是指人工的从原始数据中找出、构造出具有业务意义的特征。这个部分需要根据业务知识观察原始数据，思考问题的潜在影响形式，构造加入新的特征。属性的分割和组合是常用的方法。有协同作用的特征可以考虑其协同方式，然后组合为新的特征。时间信息的不同粒度的影响不同，可以考虑分割为小时时段、周末平日等。

另外，如滴滴司机与订单的供求间隔预测比赛中，有些参赛队伍以原始订单数据组合构造出每个时段前三个小时的订单量，作为当天所在地图cell的即时订单趋势的参考。

个人理解，这个部分是包含最多个人经验，领域知识的部分。

三、特征生成

四、特征选择

猜你喜欢

转载自www.cnblogs.com/hugh-tan/p/8665485.html

机器学习知识点查漏补缺（特征工程）

java知识点查漏补缺

JS知识点查漏补缺

数据库知识点查漏补缺

Java知识点查漏补缺-Java基础

[面试 C++] 知识点查漏补缺

Leetcode刷题--知识点查漏补缺

Web前端知识点查漏补缺（更新中）

javascript基础知识点概览（查漏补缺）

做题时对知识点的查漏补缺

算法分析与设计期末知识点查漏补缺

『查漏补缺』Android实习面试知识点（一）

『查漏补缺』Android实习面试知识点（二）

前端基本知识点查漏补缺

c# 知识点查漏补缺（自用）

查漏补缺知识

机器学习 - 特征工程知识点总结

操作系统-数据库知识点查漏补缺二

前端查漏补缺全知识点合集（更新中9.3）

dll知识点查遗补缺

C++复习过程中零碎知识点（查漏补缺，持续更新）

Java基础查漏补缺之你可能不知道的final关键字的知识点

laya学习查漏补缺

JavaScript学习（一）——基础知识查漏补缺

特征工程知识点

webpack补充点---查漏补缺

（六）评分卡知识查漏补缺

【Oracle】基础知识查漏补缺

python基础知识查漏补缺

Java知识查漏补缺-02

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)