皮尔森Pearson相关系数 VS 斯皮尔曼Spearman相关系数

给定两个连续变量x和y,皮尔森相关系数被定义为:


————————————————————————————————————————————————

由于原则上无法准确定义顺序变量各类别之间的距离,导致计算出来的相关系数不是变量间的关联性的真实表示。因此,建议对顺序变量使用斯皮尔曼相关系数。

斯皮尔曼相关系数的计算采用的是取值的等级,而不是取值本身。例如,给定三个值:33,21,44,它们的等级就分别是2,1,3.  计算斯皮尔曼相关系数的公式与计算皮尔森相关系数的类似,但用等级代替了各自的取值。


相对于皮尔森相关系数,斯皮尔曼相关系数对于数据错误和极端值的反应不敏感。

斯皮尔曼相关系数的另一种公式表示如下:


猜你喜欢

转载自blog.csdn.net/lambsnow/article/details/79972145