特征筛选的原理与实现 - 代码天地

特征筛选的原理与实现

其他 2020-08-11 11:43:55 阅读次数: 0

特征工程又包含了Feature Selection（特征选择）、Feature Extraction（特征提取）和Feature construction（特征构造）等子问题，本章内容主要讨论特征选择相关的方法及实现。

在实际项目中，我们可能会有大量的特征可使用，有的特征携带的信息丰富，有的特征携带的信息有重叠，有的特征则属于无关特征，如果所有特征不经筛选地全部作为训练特征，经常会出现维度灾难问题，甚至会降低模型的准确性。因此，我们需要进行特征筛选，排除无效/冗余的特征，把有用的特征挑选出来作为模型的训练数据。

特征选择介绍

1.特征按重要性分类

相关特征：
对于学习任务（例如分类问题）有帮助，可以提升学习算法的效果；
无关特征：
对于我们的算法没有任何帮助，不会给算法的效果带来任何提升；
冗余特征：
不会对我们的算法带来新的信息，或者这种特征的信息可以由其他的特征推断出；

特征类型筛选

示例代码

# 数字特征(包括int,float)
df.select_dtypes(include=[np.number])
# 数字特征(bool)
df.select_dtypes(include='bool')
# 数字特征(float64)
df.select_dtypes(include='float64')
# 数字特征(不包括float64)
df.select_dtypes(exclude='float64')
# 类型特征
df.select_dtypes(include=[np.object])

2.特征选择的目的

对于一个特定的学习算法来说，哪一个特征是有效的是未知的。因此，需要从所有特征中选择出对于学习算法有益的相关特征。而且在实际应用中，经常会出现维度灾难问题。如果只选择所有特征中的部分特征构建模型，那么可以大大减少学习算法的运行时间，也可以增加模型的可解释性。

猜你喜欢

转载自blog.csdn.net/qq_39974560/article/details/107927707

特征筛选的原理与实现

特征工程系列：特征筛选的原理与实现（下）

特征工程系列：特征筛选的原理与实现（上）

特征筛选之特征递归消除法及Python实现

LBP特征原理及代码实现

LBP特征原理及C实现

HOG特征原理及代码实现

特征提升之特征筛选

特征工程之特征筛选

特征工程之_筛选

机器学习-特征筛选

特征选择/筛选方法

随机森林的REF递归特征消除法来筛选特征（python实现不依赖sklearn)

sift算子特征点提取原理及实现

图像特征LBP原理及C++实现

LBP特征提取原理及代码实现

数据筛选特征方法-递归特征消除

特征选择 | 递归特征消除算法筛选最优特征

特征筛选利器：详解T-test（T检验）原理、参数分析、单\双尾检验选择

特征筛选5——距离相关系数筛选特征（单变量筛选）

特征筛选6——肯德尔相关系数筛选特征（单变量筛选）

ORB特征描述原理、python实现及基于opencv实现

最佳特征筛选与feature_selection

sklearn数据特征重要程度的筛选

筛选重要特征的方法feature_importance_

【机器学习】编码、创造和筛选特征

Halcon XLD 生成提取&测量及特征筛选

特征筛选——风控业务为例

推荐这款机器学习的特征筛选神器！

最新特征筛选方法--Deep Lasso

今日推荐

技术解析 GPT-4o：即时语音交互的突破与 GenAI 发展策略

开源大模型与闭源大模型

微信小程序授权登录获取用户的openid

亿级流量系统架构设计与实战

人工智能时代的程序设计教学与课程设计

纽交所技术问题致伯克希尔 (BRK.A) 显示跌近 100%

周排行

《Python 编程-从入门到实践》11-1~11-3

关于Numpy+TensorFlow+PyTorch构造NN的总结

【原创达人】制作WINPE启动盘心得

英文图片文字识别（提取）

2022cma看片网站给一个你懂的

二叉搜索树的实现（BST）（插入+删除+查找+各种遍历+高度）

搬家通知博文地址(将博客搬到CSDN)

asfd

解决错误：MISCONF Redis is configured to save RDB snapshots, but is currently not able to persist on disk

如何注册微信个人小程序

每日归档

更多

2024-06-08(0)

2024-06-07(0)

2024-06-06(0)

2024-06-05(0)

2024-06-04(10)

2024-06-03(52)

2024-06-02(4)

2024-06-01(60)

2024-05-31(47)

2024-05-30(4)