不要跟软件挂钩。
Stata 是一套提供其使用者数据分析、数据管理以及绘制专业图表的完整及整合性统计软件。它拥有很多功能,包含线性混合模型、均衡重复反复及多项式普罗比模式。用Stata绘制的统计图形相当不错。
Stata其统计分析能力远远超过了SPSS,在许多方面也超过了SAS!由于Stata在分析时是将数据全部读入内存,在计算全部完成后才和磁盘交换数据,因此计算速度极快(一般来说, SAS的运算速度要比SPSS至少快一个数量级,而Stata的某些模块和执行同样功能的SAS模块比,其速度又比SAS快将近一个数量级!)Stata也是采用命令行方式来操作,但使用上远比SAS简单。其生存数据分析、纵向数据(重复测量数据)分析等模块的功能甚至超过了SAS。用Stata绘制的统计图形相当精美,很有特色。
SPSS(Statistical Product and Service Solutions),“统计产品与服务解决方案”软件。最初软件全称为“社会科学统计软件包”(Solutions Statistical Package for the Social Sciences),但是随着SPSS产品服务领域的扩大和服务深度的增加,SPSS公司已于2000年正式将英文全称更改为“统计产品与服务解决方案”,这标志着SPSS的战略方向正在做出重大调整。SPSS为IBM公司推出的一系列用于统计学分析运算、数据挖掘、预测分析和决策支持任务的软件产品及相关服务的总称,有Windows和Mac OS X等版本。
1984年SPSS总部首先推出了世界上第一个统计分析软件微机版本SPSS/PC+,开创了SPSS微机系列产品的开发方向,极大地扩充了它的应用范围,并使其能很快地应用于自然科学、技术科学、社会科学的各个领域。世界上许多有影响的报刊杂志纷纷就SPSS的自动统计绘图、数据的深入分析、使用方便、功能齐全等方面给予了高度的评价。
总之上面两个是一个统计软件,统计方面有很多内容。
相关系有诸多概念,同时相关系与因果性是一个大问题。目前的机器学习(ML)等等都是以此为基准展开的。相关性问题与因果性问题,几乎成了一个基本的哲学问题。
上面一篇论文的论证方式,整体的逻辑结构非常有特色,第一部分用到了stata。结合这篇文章分下面三个部分简单的描述一下。
相关性一般指的是两个(或者多个)随机变量(或随机向量)之间的(线性)相关性,它代表了两个变量之间的某种量化关系。
量化出来无非是相关或者不相关。
很显然这部分的基本操作(基操)如下
其中原始数据比较多是调查。
箭头上面 一般是用统计软件 stata 、spss等等 ,当然一些特殊情况需要专门编程。
以原来的论文为例子。
先对变量进行了描述。
并进行了一定的处理,(可以称之为规范,数据清洗),以适合统计软件识别。
上面是简单的原理描述。
上面是统计软件运行后的结果。
上面整个部分主要是以相关性为主的。
相关性与因果性不同。
相关性可以理解成重要性,要素跟要素两者之间的比较性的关系,与之对应的是无向图。
因果性则是要素跟要素之间的因果关系,导致关系,可达关系,与之对应的是有向图。
以例子中的论文为例。
开始假设了14个要素。
通过相关性分析后,发现10个要素是相关性强的。
那么这10个要素相互之间是怎么作用的?最终呈现什么样的因果层次结构?
这就可以通过ISM模型或者AISM模型来解释。
上面是由专家分析得到的原始关系矩阵
上面是自动计算的软件。
输入A后,可以自动的得到可拖拽的对抗层级拓扑图。
上面是对抗层次拓扑图展示的结果(这个图巨丑,画得太难看!!)
例子中采用的回归——AISM模型充分体现和反映人的思维过程,具有结构清晰、计算简便、结论直观、易于理 解、可信度高等特点,可以在类似的相关性研究与因果性研究中广泛运用。
相较于文字、表格、数学符号等方式,AISM 在结果呈现上非常直观且清晰,它把评价对象(要素)看成一个结点,将存在优劣(因果)关系的结点用有向线段标识,AISM 最终以有向拓扑层级图的方式呈现结点间的优劣(因果)关系,进而很容易得出评价对象的优劣(因果)。
习惯上把越优(结果要素)的结点放置于上面的层级,越劣(原因要素)的结点放置在越下的层级,最终按照层级的高低给出各个结点的排序,最上层的结点为帕累托最优集,最下层的为最劣集。层级从下至上形成由劣到优的帕累托系列。经典的 ISM 方法求解层级过程是采用从优到劣的方式求解,即先从帕累托最优到帕累托最劣的方式求解,从层级图上看,就是从上至下放置层级要素;而本文引入了与之对立的方法,即从下层开始放置要素的方式。这两种层级抽取的方式,得到的帕累托全系列可能并不一致。
总之,图形化的表达在结果呈现上非常直观且清晰,要远优于文字、表格、数学符号等方式。
stata只是一个软件,相关性分析也并不是必须做的。甚至可以不做。这跟你具体的研究有关。
上面两个其实挺简单的,因为主要是按几下按钮