数据处理之主成分分析(R语言)

主成分分析是数据规约(包含属性规约和数值规约)的一种常用方法。用较少的变量去解释原始数据中的大部分变量,即将许多相关性很高的变量转化成彼此相互独立或不相关的变量。

举例来说,数据集如下,含有8个变量:

1、通过princomp()函数进行主成分分析

PCA = princomp(data,cor = FALSE)  #主成分分析,其中cor默认为FALSE,表示使用样本的协方差阵作主成分分析,若为TRUE表示使用相关系数矩阵

names(PCA) #查看输出项

输出如下:

2、查看主成分特征根和主成分贡献率

 (PCA$sdev)^2 #主成分特征根

summary(PCA) #主成分贡献率

输出如下:

这时,当选取3个主成分时,累计贡献率已达到97%,所以选取3个主成分。

3、查看主成分载荷和主成分得分

PCA$loadings #主成分载荷

PCA$scores #主成分得分

输出如下:

原始数据从8个变量被降维到3个变量,同时这3个变量占了原始数据95%以上的信息。

猜你喜欢

转载自blog.csdn.net/zjlamp/article/details/81462526