关于R处理数据的复习总结

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/u012429555/article/details/80830401

1 、相关系数

在R中 ,我们通过cor()计算相关系数,Pearson的相关系数,用符合r表示。

在市场营销中,r的值躲到才表明两个变量之间存在重要的相关性呢?这个要根据你所在的行业来确定。

不过一般而言我们通常使用Cochen的经验法则,这是心理学的传统。

r=0.1是弱相关 :很小心才能检测出来

r=0.3中等相关:

r>=0.5是强相关:旁观者很容易察觉

Cochen的经验法则中对r的解释取决于如下假设:变量是正态分布或者近似正态分布

如果:变量不是正态分布,而是对数正态或者其他有骗非正态分布,那么就无法参考这些阈值,

在这种情况下:可以先对数据做变化使之接近正态,然后解释变换后变量的相关性。


扫描二维码关注公众号,回复: 3583130 查看本文章

2、相关性检验

函数cor.test()可测的结果是否显著。根据P值,来判断是否显著。

相关性+显著->此关系则不能忽视!


3、变换变量

相关系数r测量的是两个变量的线性相关性。如果这个两个变量之间的关系不是线性的,是用r就具有误导性

可以使用Box-Cox这个函数来行进变换不符合正态的数据量

这个函数的使用可以在官网查询。


猜你喜欢

转载自blog.csdn.net/u012429555/article/details/80830401