皮尔逊相关系数与协方差

如何学习人工智能公式

一、公式用途

用来计算两组数据的相似程度;例如在推荐算法中,查看两个人对一些事物的看法是否类似;

一、公式推导

Pearson 相关系数,其实就是常规理解的相关系数 ( Correlation coefficient )

相关系数:
这里写图片描述
其中,E为数学期望或均值,D为方差,D开根号为标准差,E{ [X-E(X)] [Y-E(Y)]}称为随机变量X与Y的协方差,记为Cov(X,Y),即Cov(X,Y) = E{ [X-E(X)] [Y-E(Y)]},而两个变量之间的协方差和标准差的商则称为随机变量X与Y的相关系数,记为这里写pxy。

当 Y = X 时,即与方差相同。当变量 X,Y 的变化趋势一致时,如果某个 Xi 大于 EX,相应的 Yi 也大于 EY;如果某个 Xi 小于 EX,相应的 Yi 也小于 EY,那么 COV(X,Y) 就是正值,当变量 X,Y 的变化趋势相反时,那么 COV(X,Y) 就是负值。

除以两者的标准差,可以将该参数归一化到[-1,1]的区间内。

二、公式应用

通常情况下通过以下相关系数取值范围判断变量的相关强度:

0.8-1.0 极强相关
0.6-0.8 强相关
0.4-0.6 中等程度相关
0.2-0.4 弱相关
0.0-0.2 极弱相关或无相关

扫描二维码关注公众号,回复: 2482419 查看本文章

两个变量之间的皮尔逊相关系数定义为两个变量之间的协方差和标准差的商:
这里写图片描述

猜你喜欢

转载自blog.csdn.net/xihuanyuye/article/details/81286603