机器学习面笔试-特征提取篇 - 代码天地

机器学习面笔试-特征提取篇

其他 2018-09-01 14:11:16 阅读次数: 0

版权声明：本文为博主siucaan原创文章，转载请注明出处。 https://blog.csdn.net/qq_23869697/article/details/82148913

1. 为什么要做特征选择？

特征选择主要有两个功能：
(1)减少特征数量、降维，使模型泛化能力更强，减少过拟合
(2)增强对特征和特征值之间的理解

2. 常用的特征选择方法[这里]

(1)去掉取值变化小的特征
针对特征值都是离散型变量；
(2)单变量特征选择
单变量特征选择能够对每一个特征进行测试，衡量该特征和响应变量之间的关系，根据得分扔掉不好的特征。对于回归和分类问题可以采用卡方检验等方式对特征进行测试。
a.Pearson相关系数
b.互信息和最大信息系数
c.距离相关系数
d.基于学习模型的特征排序
(3)线性模型
基于机器学习模型的方法。有些机器学习方法本身就具有对特征进行打分的机制，或者很容易将其运用到特征选择任务中，例如回归模型，SVM，决策树，随机森林等等。
具体的例子参考上面的参考。

3.SVD和PCA

PCA的理念是使得数据投影后的方差最大，找到这样一个投影向量，满足方差最大的条件即可。而经过了去除均值的操作之后，就可以用SVD分解来求解这样一个投影向量，选择特征值最大的方向。

4.何为共线性, 跟过拟合有什么关联?

共线性：多变量线性回归中，变量之间由于存在高度相关关系而使回归估计不准确。
共线性会造成冗余，导致过拟合。
解决方法：排除变量的相关性／加入权重正则。

5.多重共线性

多重共线性是指当两个特征的相关性很大的时候，会对参数模型造成非常大的影响。可以用相关分析判断多重共线性的存在性。

6.PCA的计算过程

(1)去除均值
(2)计算协方差矩阵
(3)计算特征值和特征向量
(4)特征值从大到小排序
(5)保留前N个特征向量
(6)投影重构（记得吧去除的均值还回去）
或者
(1)去均值
(2)SVD计算

猜你喜欢

转载自blog.csdn.net/qq_23869697/article/details/82148913

机器学习面笔试-特征提取篇

机器学习 - 特征提取

机器学习---特征提取

【机器学习】特征提取

机器学习之sklearn特征提取

机器学习实战——LBP特征提取

机器学习笔记-特征提取

机器学习-特征提取68

机器学习---文字特征提取

【机器学习】特征提取-TFIDF

机器学习中的特征提取

机器学习特征提取 | 自动特征工程featuretools

机器学习-特征工程-字典特征提取

机器学习系列(4)_特征工程02特征提取

【机器学习】特征工程 - 字典特征提取

【机器学习】特征工程 - 文本特征提取CountVectorizer

【机器学习】特征工程 - 文本特征提取TfidfVectorizer

机器学习图像特征提取—SIFT特征提取原理及代码实现

机器学习图像特征提取—LBP纹理特征提取原理及代码实现

机器学习图像特征提取—颜色（RGB、HSV、Lab）特征提取并绘制直方图

机器视觉：特征提取

tesseractOCR 特征提取篇----MF特征提取

机器学习之路：python 字典特征提取器 DictVectorizer

机器学习之路：python 文本特征提取 CountVectorizer, TfidfVectorizer

机器学习笔记——降维（特征提取）

机器学习 scikit-learn 特征提取

【技术分享】机器学习之数据清洗与特征提取

【机器学习】特征提取代码汇总

机器学习（机器学习介绍、特征工程和文本特征提取）

机器学习图像特征提取—灰度共生矩阵（GLCM）纹理特征提取原理及代码实现

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)