百科问答小站 logo
百科问答小站 font logo



心理统计里的相关系数和显著性值怎么理解? 第1页

  

user avatar   hua-sha-94 网友的相关建议: 
      

题主其实问了两个问题:1. 相关系数到底什么意思?2. 如何比较两个相关系数?

首先,如果按照常见的 值设置,那么两个相关分析都显著。那我们进一步默认上述相关分析都是使用的皮尔逊积差相关,是一种对于两个变量线性关系的衡量:

其次, 值不能直接理解为斜率。比如题主问到:

比如前一个是显著性强,相关性中等,这句话应该理解成自变量确实影响因变量,影响的程度中等(比如自变量增长2个点,因变量增长1个点)

很明显,带回公式的话,就会发现不合理。如果从数学角度分析原因的话,那么我们需要把公示改写:

其中 是协方差,而 是各自方差。

其实,题主所理解的是回归线(或者是最小二乘)的斜率(slope): 或者 。

在最简单的线性回归中:

根据最小二乘法,我们可以推出:

所以只有 也就是 时候, 。


那么如何比较两个相关系数呢?

那么当然还是假设检验,比较 背后的 是否有差异。如果情况是想要检测同样变量X和Y在不同群体之间的关系强弱,那么可以用Fisher[1]的方法。公示如下:

1.对原始 进行转换: ;

2.然后,对转换后的 们进行 检验: ;

3. 最后进行假设检验即可。


你看,统计还是不复杂的!

参考

  1. ^ Fisher, R. A. (1921). On the'probable error'of a coefficient of correlation deduced from a small sample. Metron, 1, 1-32.



  

相关话题

  统计模型和概率模型的区别是什么呢? 
  为什么有的公司统计双十一下单额,有的统计成交额? 
  为什么我用相同的模型,数据,超参,随机种子,在两台服务器会得到不同的结果? 
  为何2005-2015年人口抽样调查中少数民族增加数大幅减少? 
  如何计算一组三维空间角度数据的方差(或者说离散程度)? 
  因素分析、熵值法的用法区别是什么? 
  什么是归一化,适用场景是什么?请举个例子说明归一化带来的好处是什么? 
  什么是非独立同分布(Non-IID)数据,有没有很简单的解释方法? 
  机器学习中的 Bias(偏差)、Error(误差)、Variance(方差)有什么区别和联系? 
  第一类错误和第二类错误的关系是什么? 

前一个讨论
如何看待香港渔农署宣布此前对病毒测试呈阳性的狗已经低程度感染新冠病毒?
下一个讨论
为什么中国没有形成超大型的内陆湖?





© 2025-02-07 - tinynew.org. All Rights Reserved.
© 2025-02-07 - tinynew.org. 保留所有权利