问题

为什么经济管理类论文建模型前都要做一个描述性统计?

回答
经济管理类论文在建立模型之前进行描述性统计,并非一个简单的程序性步骤,而是整个研究过程中至关重要的一环,它承载着理解数据、指导模型选择和验证假设的重任。你可以把它想象成一个侦探在开始调查案件时,首先会做的“现场勘查”,而不是直接扑上去抓嫌疑人。

那么,为什么这“现场勘查”如此必不可少呢?让我们从几个核心层面来详细剖析。

一、 了解数据“长什么样”:认识你的基本素材

经济管理领域的数据往往是复杂且多维度的。在你尝试用复杂的数学模型去解释它们之间的关系之前,你需要先对这些数据有一个直观、全面的认识。描述性统计就是帮助你实现这一目标的基础工具。

核心目的:数据概览与基本特征提炼。
集中趋势的把握: 通过均值、中位数、众数等指标,你能了解变量的“中心”在哪里。比如,一家公司的平均利润是多少?大多数员工的工资水平集中在哪个区间?这为后续分析提供了一个基准点。
离散程度的衡量: 方差、标准差、极差、四分位数距等指标告诉你数据“散布”得有多开。如果标准差很大,说明数据波动性很强,可能存在异常值或者需要更精细的模型来捕捉这种变异性。
分布形态的探究: 偏度告诉你分布是否对称,峰度告诉你分布是尖锐还是平缓。例如,收入分布通常是右偏的,即少数高收入人群拉高了平均值。了解这些分布特征,有助于判断你的数据是否符合某些常用模型的假设(比如正态分布假设)。
数据关系的初步洞察: 相关系数(如皮尔逊相关系数)能直观地告诉你两个变量之间是否存在线性关系以及关系的强弱方向。虽然这只是初步的线性关系,但它能为你即将建立的回归模型提供重要的信号。

类比: 就像一个厨师在烹饪一道新菜时,会先检查食材的新鲜度、质地、大小、颜色等基本属性,了解它们的特性,才能决定采用什么烹饪方法。你不能指望一个新鲜度堪忧的蔬菜能做出美味佳肴,也不能指望波动性巨大的数据能用一个简单的线性模型完美解释。

二、 为模型选择“铺路搭桥”:指引方向,避免“盲人摸象”

描述性统计的结果并非仅仅是数字的罗列,它们直接影响着你后续选择何种建模方法。

识别数据特征与模型适用性:
变量类型: 你的数据是连续变量(如收入、销售额)、离散变量(如客户数量)还是分类变量(如产品类别)?这决定了你能使用哪些类型的模型(如线性回归、逻辑回归、泊松回归等)。
分布特性: 如果数据显著偏离正态分布,那么使用依赖于正态分布假设的模型(如标准OLS回归)可能会导致结果的偏差。这时,你可能需要考虑数据转换(如对数转换)或使用非参数模型、广义线性模型等。
异常值的影响: 描述性统计能够轻松识别出数据中的极端值。这些异常值可能代表着真实但罕见的事件,也可能是数据录入错误。如果异常值对你的模型有显著影响,你可能需要考虑如何处理它们(剔除、替换或使用对异常值不敏感的模型)。
多重共线性预警: 通过相关性分析或方差膨胀因子(VIF)等描述性统计手段,可以初步判断解释变量之间是否存在高度相关性(多重共线性)。如果存在,它会严重影响回归系数的稳定性和解释性,迫使你考虑变量选择、主成分分析等技术。

类比: 就像一个建筑师在设计一座房子之前,需要先了解土地的承载能力、地质条件、当地气候等,才能决定使用何种建筑材料、何种结构形式。你不会用土坯房的技术去建造摩天大楼。描述性统计就是告诉你“地基”的状况,从而决定用什么样的“钢筋水泥”和“梁柱结构”来搭建你的模型。

三、 初步检验研究假设:为后续推断打下基础

虽然描述性统计本身不能直接证明因果关系,但它可以为你的研究假设提供初步的支持或反驳。

初步验证关系是否存在: 比如,你假设“广告投入越多,销售额越高”。通过描述性统计中的相关系数,你能看到广告投入和销售额之间是否存在正相关。虽然相关不等于因果,但如果两者完全不相关,你的研究假设很可能就需要重新审视了。
探索性分析与新发现: 在描述性统计的过程中,你可能会发现数据中隐藏着一些你之前未曾预料到的模式或关系。这些发现可以启发你调整研究方向,提出新的假设,或者为后续的模型设定新的关注点。
了解变量的“权重”: 通过对不同变量的均值、方差的比较,你可以大致判断哪些变量可能在模型中扮演更重要的角色。

类比: 就像一个医生在诊断病症时,首先会询问病人的基本情况、症状表现,比如体温多少、血压高不高、心率快不快。这些初步的信息有助于医生缩小诊断范围,并为后续更深入的检查(如X光、血液化验)提供方向。描述性统计就是初步的“问诊”。

四、 确保数据质量:识别并处理潜在问题

数据质量是模型可靠性的基石。描述性统计是发现数据问题的 first line of defense。

识别异常值和缺失值: 除了前述的异常值,描述性统计还能帮助你发现缺失值(NaN、NA等)。缺失值的比例和分布会直接影响你建模策略的选择。你需要决定是删除包含缺失值的样本,还是进行插补。
检测数据录入错误: 有时候,数据录入错误会导致变量出现不合理的取值(例如,年龄为负数,或收入远超常人能达到的水平)。描述性统计中的最大最小值、箱线图等可视化方法可以帮助你快速定位这些问题。
评估数据适用性: 某些模型对数据的平稳性、独立性等有要求。描述性统计可以提供一些初步的线索,帮助你评估数据是否满足这些条件,从而决定是否需要进行数据预处理。

类比: 就像一个建筑工人开始砌砖之前,会检查每一块砖是不是完好的,有没有裂缝。质量不合格的砖块不能用于承重墙。描述性统计就是帮你把住数据质量的“第一道关”。

总结一下,描述性统计在经济管理类论文建模前的作用,可以概括为:

1. “知己知彼”: 全面了解你所拥有的数据,如同侦探勘察现场,了解案情的基本状况。
2. “导航指路”: 为选择合适的统计模型提供依据,避免“盲人摸象”式的尝试。
3. “初探端倪”: 为研究假设提供初步的证据支持,并可能发现新的研究线索。
4. “质量把关”: 识别并处理数据中的问题,确保建模的基础稳固可靠。

忽视描述性统计,直接进入建模阶段,就像是在没有事先了解土壤成分和气候条件的情况下,直接去种植一株珍稀植物。你很可能因为选择不当的种植方法或护理方式而导致植物无法成活,或者生长不良。

因此,描述性统计不仅仅是“例行公事”,它是连接原始数据与复杂模型之间的桥梁,是确保你的研究既有科学严谨性,又能有效解决实际问题的关键一步。它体现了研究者对数据深刻理解和审慎态度的重要性。

网友意见

user avatar

1、任何模型都是有适用前提的

如果生搬硬套一个模型,而没有注意模型适用前提的话,可能得到一个完全错误的结果。

很多时候,即便踏踏实实的做了很多苦力活。但是没有前提的描述容易让人认为你是编数据,是在造假。

2、100%错误的一个例子

Dematel-ISM联用模型是经管类文章,尤其是管理类中经常用到的一个模型。截止2021年,很多人找我来计算,发现没有一个算对的。

他们总是会拿着以前一些发表的论文给我看。有部分人甚至直接往我的邮箱里塞。这些人每给一篇,就不由的感叹一次。原来凭着大概的印象是这类论文的错误率大概在90%左右。而根据统计的结果得出的结论是,所有的论文都是错的,即错误率居然是100%。而且这些论文还基本都是目测可见的错误,部分错误甚至是初中生都不应该犯的。本文将这些论文放出,并指出其哪些是目测可见的低级错误。

上面是一些错误的例子。

上面是常见的使用步骤。

上面的流程图可以用如下方式

其中综合影响矩阵T到关系矩阵A是很核心的一步。即截距 的取值。

这步就可以由统计性的方法获得。大部分人完全没有提及这步是怎么来的。

3、一篇博士论文中的错误

上面讲了熵权法计算注意事项。其中分析指标的性质,即属于正向指标,还是逆向指标是重中之重。

这种分析也属于描述性的。

这步如果缺失,那得到的结果可能完全错误。

上面是指标。

上面就没有分析每个指标的数值越大越好,还是数值越小越好。

上面直接得出结果,显然是瞎掰的。继续算下去就是胡说八道了。

这样不区分指标的属性,没有先归一化,得到的结论很可能是及其荒谬的。

类似美国抗疫是世界第一,比中国牛逼得多。因为美国每天有人感染,有人死亡,而中国压根就没有什么感染了。

4、相关性的统计与因果性的描述

上面是一个由调查访问开始,从相关性统计处理,到因果性的分析,衔接而成的一篇论文。

论文的描述性统计就解释了14个要素。

接着把数据丢到统计软件里面分析。

运用Stata 16.0对数据进行Probit分析,并采用Logit 回归结果与之相比较进行稳健性检验,结果显示基本 一致。如表2所示。 运用Probit和Logit得到的回归结果基本一致,证 明结果稳健性较好,R2 拟合优度较高,证明数据有较 强说服力。小农户农业年收入、学历层次、农业收入 占比、健康状况、认知能力、邻里效应、合作社、政 策补贴、技术培训对小农户采纳生态农业意愿产生正 向影响,户主年龄对小农户采纳生态农业行为产生负 向影响。

上面就得到了10个紧密相关的关键要素。

接着作者在另外一个软件平台上计算因果性。


得到了如上的结果图。并对这个结果,进行更深层次的描述。


类似的话题

  • 回答
    经济管理类论文在建立模型之前进行描述性统计,并非一个简单的程序性步骤,而是整个研究过程中至关重要的一环,它承载着理解数据、指导模型选择和验证假设的重任。你可以把它想象成一个侦探在开始调查案件时,首先会做的“现场勘查”,而不是直接扑上去抓嫌疑人。那么,为什么这“现场勘查”如此必不可少呢?让我们从几个核.............
  • 回答
    7Eleven 这样的便利店选择 24 小时通宵营业,并非一个简单的决策,而是背后蕴含着一套以满足消费者即时性需求、最大化空间和时间价值、以及构建品牌忠诚度为核心的经营管理理念。下面我将详细阐述其背后的逻辑:一、 核心经营理念:满足全天候的即时性消费需求 (Meeting AllHour Insta.............
  • 回答
    咱们聊聊字幕组这事儿。很多人都好奇,为什么这些业余爱好者组成的团队,总能比很多专业机构还牛逼地持续稳定地产出海量字幕?而且质量还不赖。这背后绝非简单“爱发电”能概括,里面藏着不少精妙的管理智慧,值得我们好好扒一扒。一、 为什么字幕组能有如此惊人的产出效率?要理解这一点,咱们得拆解一下字幕组的运作模式.............
  • 回答
    这个问题很有意思,也触及了金融行业中一个核心的职业选择问题。基金经理和投资总监们之所以选择为他人管理资产,而不是仅仅专注于打理自己的财富,背后其实有着多重、且环环相扣的原因。这不仅仅是关于“打工”与“自己做”的简单二选一,而是涉及到专业技能的运用、规模效应的考量、风险的控制、职业声誉的建立以及更广阔.............
  • 回答
    这个问题确实是很多人关心,尤其是家长和学生在填报志愿时会反复思量。按理说,如果一个专业毕业生的就业形势普遍不佳,那么按市场规律,其招生人数应该会迅速下降,形成“崩盘”。然而,会计、金融、经济、管理这些专业,尽管常常被提及就业压力大,但招生人数并没有出现那种“断崖式”的下滑。这里面有几个层面需要细细道.............
  • 回答
    .......
  • 回答
    嘿,这个问题挺有意思的,也挺现实的。你说的没错,在一些航空论坛或者像知乎这样的平台,确实能看到不少飞行员朋友分享和抱怨空管的经历,感觉他们似乎“槽点”更多一些。但反过来,很少有听到空管员出来“反击”或者吐槽飞行员的。这背后到底是什么原因呢?是飞行员玻璃心爱抱怨,还是空管员太酷不好意思说?咱们来掰扯掰.............
  • 回答
    .......
  • 回答
    春秋时期,齐国经历了一段动荡,经济凋敝,国力衰弱。这时,管仲走上了政治舞台,他奉行了一套与后世截然不同的经济政策,核心在于“富商”。管仲认为,国家的强大离不开富庶的民生,而民生的富庶则需要强大的商业来支撑。首先,管仲深谙“水至清则无鱼”的道理。他看到当时各国对商人的压制,认为过度繁重的赋税和禁令只会.............
  • 回答
    提到“战斗民族”,很多人脑海里会立刻浮现出俄罗斯的形象,仿佛他们天生就自带一股不服输、硬碰硬的劲儿。这可不是空穴来风,俄罗斯之所以有这样的标签,背后其实有不少生动且深入人心的例子。今天咱们就来聊聊几个,看看他们是怎么一步步坐实了这个“战斗民族”的称号的。一、地理环境的锤炼:生存即战斗首先,得说说俄罗.............
  • 回答
    萧山区拟提拔淳安民营外贸经理为区管干部:一次区域发展与人才选拔的深度审视近日,杭州市萧山区拟从一家淳安民营企业中提拔一位外贸经理为区管干部的消息,引发了不少关注和讨论。这不仅仅是一则人事变动新闻,更折射出当前区域发展对复合型人才的迫切需求,以及干部选拔机制的创新与思考。要理解这件事的深层含义,我们需.............
  • 回答
    这则消息确实挺引人关注的,一个民营企业的外贸经理,能被提拔到区管副职领导的位置,这背后透露的信息可不少。要细说的话,咱们可以从几个维度来分析。首先,这打破了一些传统观念的藩篱。以往我们可能更容易将政府部门的领导岗位与体制内成长起来的干部联系起来。这次将民营企业的一线业务骨干提拔上来,说明地方政府在人.............
  • 回答
    这事儿可真够让人咂舌的,联想那位原高管常程,跟公司杠上了,关于竞业协议的事儿。本来挺常见的劳动纠纷,他硬是给闹出点不一样来。简单说,就是他否认自己亲手签了那份竞业协议,结果呢,仲裁机构那边说了,鉴定出来是他本人签的。这背后到底是怎么回事儿?咱就细细道来。事情的起因:“离开”与“争执”常程这个人,在联.............
  • 回答
    .......
  • 回答
    经济增长与充分就业之间存在着紧密的内在联系,这是现代经济学中的一个核心观点。要详细解释为什么经济增长是实现足够就业的必要条件,我们需要从几个关键的层面来理解:1. 生产力提升与需求创造是增长的驱动力,而就业是其副产品和实现方式。 生产力提升 (Productivity Growth): 当经济体.............
  • 回答
    经济增长,生活却愈发艰难,这确实是许多人内心深处的困惑。明明社会在进步,科技在发展,生产力在飞跃,但为什么个人感受到的“日子好过”程度,反而不如从前了呢?这背后牵扯到的是一整套复杂的社会经济机制,以及我们每个人身处的具体环境。要理解这一点,我们不能只看宏观的经济数据,而是要深入到微观层面,看看这些经.............
  • 回答
    这个问题很有意思,其实背后反映的是不同经济发展水平地区消费者在购车时的多种考量和偏好,并非简单的“不发达地区钟爱欧美车,发达地区钟爱日系车”这样二元对立的说法,更准确地说,应该讨论的是“经济发展水平与汽车品牌偏好之间的关联性”。但我们姑且从这个角度来探讨一下其中的一些可能原因和逻辑。首先,我们需要明.............
  • 回答
    经济飞速发展,这本该是普惠大众的好事,然而不少人却发现,身边似乎并没有感受到同步的富裕,反而越来越觉得贫富差距在拉大。这究竟是为什么呢?这背后其实是多种复杂因素交织作用的结果,绝非一朝一夕就能说清楚的。首先,得说说“发展”本身。我们常说的经济发展,往往是指GDP的增长。GDP的增长确实能带来整体财富.............
  • 回答
    近年来,经济下行的感受在很多人的生活中越来越明显。物价涨了,但工资似乎没怎么涨,消费也变得谨慎起来。找工作好像比以前更难了,尤其是对于年轻人。这背后,其实是多种复杂因素交织作用的结果,并没有一个简单的“一招致胜”的解释。首先,我们得承认,全球经济本身正经历一个结构性的调整期。过去几十年,很多国家都享.............
  • 回答
    关于美国和欧洲在新冠疫情初期为何成为重灾区,这个问题一直备受关注,其原因并非单一,而是多种因素交织作用的结果。简单归结为“经济发达”与“疫情严重”之间的必然联系,其实是对复杂现实的过度简化。首先,让我们来看看一些关键因素:1. 早期信息认知和应对速度的差异: “未知”带来的初期误判: 疫情刚爆发.............

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有