百科问答小站 logo
百科问答小站 font logo



用stata写论文的过程中,相关性分析是必须做的吗? 第1页

  

user avatar   feng-kuang-shen-shi-92 网友的相关建议: 
      

不要跟软件挂钩。

1、STATA与SPSS软件

Stata 是一套提供其使用者数据分析、数据管理以及绘制专业图表的完整及整合性统计软件。它拥有很多功能,包含线性混合模型、均衡重复反复及多项式普罗比模式。用Stata绘制的统计图形相当不错。

Stata其统计分析能力远远超过了SPSS,在许多方面也超过了SAS!由于Stata在分析时是将数据全部读入内存,在计算全部完成后才和磁盘交换数据,因此计算速度极快(一般来说, SAS的运算速度要比SPSS至少快一个数量级,而Stata的某些模块和执行同样功能的SAS模块比,其速度又比SAS快将近一个数量级!)Stata也是采用命令行方式来操作,但使用上远比SAS简单。其生存数据分析、纵向数据(重复测量数据)分析等模块的功能甚至超过了SAS。用Stata绘制的统计图形相当精美,很有特色。


SPSS(Statistical Product and Service Solutions),“统计产品与服务解决方案”软件。最初软件全称为“社会科学统计软件包”(Solutions Statistical Package for the Social Sciences),但是随着SPSS产品服务领域的扩大和服务深度的增加,SPSS公司已于2000年正式将英文全称更改为“统计产品与服务解决方案”,这标志着SPSS的战略方向正在做出重大调整。SPSS为IBM公司推出的一系列用于统计学分析运算、数据挖掘、预测分析和决策支持任务的软件产品及相关服务的总称,有Windows和Mac OS X等版本。

1984年SPSS总部首先推出了世界上第一个统计分析软件微机版本SPSS/PC+,开创了SPSS微机系列产品的开发方向,极大地扩充了它的应用范围,并使其能很快地应用于自然科学、技术科学、社会科学的各个领域。世界上许多有影响的报刊杂志纷纷就SPSS的自动统计绘图、数据的深入分析、使用方便、功能齐全等方面给予了高度的评价。

总之上面两个是一个统计软件,统计方面有很多内容。

2、一篇论文的例子

相关系有诸多概念,同时相关系与因果性是一个大问题。目前的机器学习(ML)等等都是以此为基准展开的。相关性问题与因果性问题,几乎成了一个基本的哲学问题。

上面一篇论文的论证方式,整体的逻辑结构非常有特色,第一部分用到了stata。结合这篇文章分下面三个部分简单的描述一下。

2.1、相关性分析部分

相关性一般指的是两个(或者多个)随机变量(或随机向量)之间的(线性)相关性,它代表了两个变量之间的某种量化关系。

量化出来无非是相关或者不相关。

很显然这部分的基本操作(基操)如下

其中原始数据比较多是调查。

箭头上面 一般是用统计软件 stata 、spss等等 ,当然一些特殊情况需要专门编程。

以原来的论文为例子。

先对变量进行了描述。

并进行了一定的处理,(可以称之为规范,数据清洗),以适合统计软件识别。

上面是简单的原理描述。

上面是统计软件运行后的结果。

上面整个部分主要是以相关性为主的。

2.2、因果性部分

相关性与因果性不同。

相关性可以理解成重要性,要素跟要素两者之间的比较性的关系,与之对应的是无向图。

因果性则是要素跟要素之间的因果关系,导致关系,可达关系,与之对应的是有向图。

以例子中的论文为例。

开始假设了14个要素。

通过相关性分析后,发现10个要素是相关性强的。

那么这10个要素相互之间是怎么作用的?最终呈现什么样的因果层次结构?

这就可以通过ISM模型或者AISM模型来解释。

上面是由专家分析得到的原始关系矩阵



上面是自动计算的软件。

输入A后,可以自动的得到可拖拽的对抗层级拓扑图。

3、模型的直观性问题

上面是对抗层次拓扑图展示的结果(这个图巨丑,画得太难看!!)

例子中采用的回归——AISM模型充分体现和反映人的思维过程,具有结构清晰、计算简便、结论直观、易于理 解、可信度高等特点,可以在类似的相关性研究与因果性研究中广泛运用。

相较于文字、表格、数学符号等方式,AISM 在结果呈现上非常直观且清晰,它把评价对象(要素)看成一个结点,将存在优劣(因果)关系的结点用有向线段标识,AISM 最终以有向拓扑层级图的方式呈现结点间的优劣(因果)关系,进而很容易得出评价对象的优劣(因果)。

习惯上把越优(结果要素)的结点放置于上面的层级,越劣(原因要素)的结点放置在越下的层级,最终按照层级的高低给出各个结点的排序,最上层的结点为帕累托最优集,最下层的为最劣集。层级从下至上形成由劣到优的帕累托系列。经典的 ISM 方法求解层级过程是采用从优到劣的方式求解,即先从帕累托最优到帕累托最劣的方式求解,从层级图上看,就是从上至下放置层级要素;而本文引入了与之对立的方法,即从下层开始放置要素的方式。这两种层级抽取的方式,得到的帕累托全系列可能并不一致。

总之,图形化的表达在结果呈现上非常直观且清晰,要远优于文字、表格、数学符号等方式。

总结:

stata只是一个软件,相关性分析也并不是必须做的。甚至可以不做。这跟你具体的研究有关。

上面两个其实挺简单的,因为主要是按几下按钮




  

相关话题

  相关性分析和回归分析要具有一致性吗? 
  用stata写论文的过程中,相关性分析是必须做的吗? 
  现在看,在统计学或(理论/应用)计量经济学领域,python 能完美地代替 R 和 stata 吗? 
  求多影响因素数据分析方法? 
  弱工具变量的判定指标都有什么? 
  如何评价明星胡笑的朋友圈文章 《我找到了中国 PM 2.5 的真正源头(是转基因粮食的推广种植)》? 
  用stata写论文的过程中,相关性分析是必须做的吗? 
  有哪些很有趣的数据统计值得我们了解? 
  现在看,在统计学或(理论/应用)计量经济学领域,python 能完美地代替 R 和 stata 吗? 
  对于做经验研究的经济学研究生,R 语言能否完全取代 Stata? 

前一个讨论
前男友来复合,现男友生气要分手,我应该怎么做?
下一个讨论
兵击会是传统武术的未来吗?





© 2024-10-31 - tinynew.org. All Rights Reserved.
© 2024-10-31 - tinynew.org. 保留所有权利