数据预处理—8.属性归约之主成分分析(理论及python实现) - 代码天地

数据预处理—8.属性归约之主成分分析(理论及python实现)

其他 2021-04-06 20:03:13 阅读次数: 0

文章目录

1.主成分分析介绍

主成分分析是一种用于连续属性的数据降维方法，它构造了原始数据的一个正交变换，新空间的基底去除了原始空间基底下数据的相关性，只需使用少量新变量就能够解释原始数据中大部分的变异。在应用中，通常是选出比原始变量个数少，能解释大部分数据中的变量的几个新变量来代替原始变量建模。

2.主成分分析计算步骤

在这里插入图片描述

3.PCA常用参数介绍

from sklearn.decomposition import PCA

在这里插入图片描述
两个常用属性

components_返回模型的各个特征向量
explained_variance_ratio_返回各个成分各自的方差占比（获取各个属性的贡献率）

三个常用方法

fit训练数据
transform转换数据
inverse_transform逆转换数据

4.PCA实战

from sklearn.decomposition import PCA
import pandas as pd

data = pd.read_excel('data/principal_component.xls',header=None)
pca = PCA()
pca.fit(data)
print(pca.components_)    # 返回各模型的特征向量
print(pca.explained_variance_ratio_.cumsum())  # 返回各个成分各自的方差占比

# 发现选取前3个累计贡献率就达到了97%
pca1 = PCA(n_components=3,copy=True,whiten=False)
pca1.fit(data)
low_data = pca1.transform(data)    # 降维后的数据
pd.DataFrame(low_data).to_excel('low_data.xls')

pca1.inverse_transform(low_data)    # 可以使用inverse_transform函数复原数据

原始数据从8维降到3维，同时这三维数据占了原始数据95%以上的信息。
参考

《python数据分析与挖掘实战》

如果对您有帮助，麻烦点赞关注，这真的对我很重要！！！如果需要互关，请评论留言！
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/weixin_46649052/article/details/115345719

数据预处理—8.属性归约之主成分分析(理论及python实现)

数据处理之主成分分析（R语言）

数据降维之主成分分析

Python专栏 | MNE数据预处理方法——独立成分分析

python数据分析之主要成分分析（PCA）

【Python数据分析】数据预处理3——数据规约（含主成分分析详解、Python主要预处理函数）

机器学习入门之主成分分析（及MATLAB实现）

数据降维之主成分分析法（PCA）

多元统计之主成分分析（PCA）

机器学习之主成分分析PCA

机器学习之主成分分析（PCA）

降维实例之主成分分析

深度学习笔记之主成分分析

数学建模之主成分分析

机器学习之主成分分析

降维之主成分分析(PCA)

DeepLearning (三) 预处理：主成分分析与白化

PCA主成分分析Python实现

主成分分析python代码实现

python-主成分分析实现

python实现主成分分析（PCA）

使用 Python 进行数据预处理中用到的各个扩展库及对应函数拉格朗日插值法，主成分分析等

降维之主成分分析法（PCA）主成分分析（PCA）原理总结

数学建模之主成分分析法

机器学习之主成分分析PCA（降维）

机器学习之主成分分析法

机器学习降维之主成分分析(PCA)

再谈协方差矩阵之主成分分析

机器学习之主成分分析——基于Scikit-Learn

机器学习降维之主成分分析

今日推荐

Electron中的关于静态资源加载问题解决方案

《Cursor-AI编程》基础篇-界面指南

《Cursor-AI编程》基础篇-Tab代码智能补充

《Cursor-AI编程》基础篇-Composer功能详解

《Cursor-AI编程》基础篇-Chat功能详解

《Cursor-AI编程》进阶篇-自定义模型

《Cursor-AI编程》进阶篇-上下文详解

【大模型系列篇】最强检索增强技术GraphRAG基本原理详解

【大模型系列篇】基于Ollama和GraphRAG v2.0.0快速构建知识图谱

解释什么是迁移学习？在 CNN 中如何应用？（面试题200合集，高频、关键）

解释数据增强（Data Augmentation）的概念和方法（（面试题200合集，高频、关键））

揭秘大模型“魔法”：Function Calling 让 AI 不止会说，更能“做”！

周排行

集成学习——LightGBM原理理解

java复制pdf并且往pdf文件中添加内容

DRF的解析器和渲染器 DRF的解析器和渲染器

pytest以函数形式的测试用例

CSS3 边框

C语言编程经典案例，三种方法求水仙花数（附完整代码）

算法题（313）

css如何让背景透明，文字不透明

linux下网络程序遭遇SIGPIPE的解决（转）

用xposed Hook框架Hook 安卓apk的按钮Id

每日归档

更多

2025-04-13(999)

2025-04-12(10529)

2025-04-11(9561)

2025-04-10(1213)

2025-04-09(10354)

2025-04-08(12998)

2025-04-07(0)

2025-04-06(0)

2025-04-05(0)

2025-04-04(0)