百科问答小站 logo
百科问答小站 font logo



如何正确地理解统计学上的相关性,关联性及差异性比较,方差分析,回归? 第1页

  

user avatar   feng-kuang-shen-shi-92 网友的相关建议: 
      

相关系有诸多概念,同时相关系与因果性是一个大问题。目前的机器学习(ML)等等都是以此为基准展开的。相关性问题与因果性问题,几乎成了一个基本的哲学问题。

上面一篇论文的论证方式,整体的逻辑结构非常有特色。结合这篇文章分下面三个部分简单的描述一下。

1、相关性分析的基操

相关性一般指的是两个(或者多个)随机变量(或随机向量)之间的(线性)相关性,它代表了两个变量之间的某种量化关系。

量化出来无非是相关或者不相关。

很显然这部分的基本操作(基操)如下

其中原始数据比较多是调查。

箭头上面 一般是用统计软件 stata 、spss等等 ,当然一些特殊情况需要专门编程。

以原来的论文为例子。

先对变量进行了描述。

并进行了一定的处理,(可以称之为规范,数据清洗),以适合统计软件识别。

上面是简单的原理描述。

上面是统计软件运行后的结果。

上面整个部分主要是以相关性为主的。

2、相关性到因果性

相关性与因果性不同。

相关性可以理解成重要性,要素跟要素两者之间的比较性的关系,与之对应的是无向图。

因果性则是要素跟要素之间的因果关系,导致关系,可达关系,与之对应的是有向图。

以例子中的论文为例。

开始假设了14个要素。

通过相关性分析后,发现10个要素是相关性强的。

那么这10个要素相互之间是怎么作用的?最终呈现什么样的因果层次结构?

这就可以通过ISM模型或者AISM模型来解释。

上面是由专家分析得到的原始关系矩阵

上面是自动计算的软件。

输入A后,可以自动的得到可拖拽的对抗层级拓扑图。

3、图形化直观表达

上面是对抗层次拓扑图展示的结果(这个图巨丑,画得太难看!!)

例子中采用的回归——AISM模型充分体现和反映人的思维过程,具有结构清晰、计算简便、结论直观、易于理 解、可信度高等特点,可以在类似的相关性研究与因果性研究中广泛运用。

相较于文字、表格、数学符号等方式,AISM 在结果呈现上非常直观且清晰,它把评价对象(要素)看成一个结点,将存在优劣(因果)关系的结点用有向线段标识,AISM 最终以有向拓扑层级图的方式呈现结点间的优劣(因果)关系,进而很容易得出评价对象的优劣(因果)。

习惯上把越优(结果要素)的结点放置于上面的层级,越劣(原因要素)的结点放置在越下的层级,最终按照层级的高低给出各个结点的排序,最上层的结点为帕累托最优集,最下层的为最劣集。层级从下至上形成由劣到优的帕累托系列。经典的 ISM 方法求解层级过程是采用从优到劣的方式求解,即先从帕累托最优到帕累托最劣的方式求解,从层级图上看,就是从上至下放置层级要素;而本文引入了与之对立的方法,即从下层开始放置要素的方式。这两种层级抽取的方式,得到的帕累托全系列可能并不一致。

总之,图形化的表达在结果呈现上非常直观且清晰,要远优于文字、表格、数学符号等方式。




  

相关话题

  蜗牛从10米深的井底爬,白天爬一米,晚上下落x米,其中x为[0,2]米的随机数,那么爬上的期望是多少? 
  如何理解统计学中「自由度」这个概念? 
  确定指标权重的时候,哪个方法比较简单啊,主成分分析法还是层次分析法啊? 
  目前社会科学经验研究中「因果识别」都有哪些方法和新发展? 
  在设计计量经济学模型时,怎么判断是否应该对变量取对数? 
  统计学上标准差与标准误的区别与联系是什么? 
  如何通俗理解 beta 分布? 
  数理统计中未知参数的置信区间估计方法中,存在最佳的枢轴量吗? 
  数理统计中未知参数的置信区间估计方法中,存在最佳的枢轴量吗? 
  为何以范剑青老师的 Sure Independence Screening 为代表的筛选法没有流行呢? 

前一个讨论
电视剧《突围》中福集团原型是哪个公司?
下一个讨论
世界上除了汉族外还有哪些是比较标准的农耕民族?





© 2025-01-03 - tinynew.org. All Rights Reserved.
© 2025-01-03 - tinynew.org. 保留所有权利