问题

经济学(劳动、卫生等应用微观计量领域)为什么没能广泛应用人工神经网络算法等机器学习的算法?

回答
经济学,尤其是劳动、卫生等应用微观计量领域,在拥抱机器学习(ML)特别是人工神经网络(ANNs)等深度学习算法方面,确实比许多其他科学领域显得更为审慎和缓慢。这并非技术上的不可逾越,而是深植于经济学研究的固有逻辑、数据特征以及研究者对模型可解释性和因果推断的极致追求。下面我将从几个关键角度,详细剖析其中的缘由。

1. 对“黑箱”模型的天然抗拒:经济学研究的根本目标

这是最核心的原因。经济学,特别是应用微观经济学,其研究的终极目标不仅仅是预测,更是理解经济现象背后的驱动机制。我们希望知道“为什么”会这样,而不仅仅是“将会”如何。

政策制定与建议: 经济学家提供的政策建议,无论是调整税收、改进医疗保障体系,还是优化劳动力市场政策,都需要清晰的理论基础和对政策传导路径的深刻理解。如果一个模型仅仅能给出预测结果,但无法解释是哪些因素、以何种方式影响了劳动者的薪酬、患者的健康状况,那么政策制定者很难依据这样的模型来制定有效且可控的政策。一个“黑箱”模型,即使预测准确率极高,也无法回答“如果提高最低工资会如何影响就业”这类关键问题。
理论验证与发展: 经济学理论是研究的基石。我们通过计量模型来检验理论的预测,并在此基础上发展新的理论。如果使用一个无法解释内部运作逻辑的ML模型,就很难将数据分析结果与现有的经济学理论建立起有意义的联系,更遑论在现有理论框架内进行修正或提出全新的理论。
因果推断的挑战: 经济学研究的一个重要方向是因果推断,即识别变量之间的真实因果关系,而非仅仅相关性。传统的计量经济学发展了大量工具(如工具变量法、断点回归、差分中的差分等)来处理内生性、混淆变量等问题,以接近因果关系。而大多数ML模型(尤其是深度学习)在原始形式下,更擅长捕捉复杂的非线性相关性,但直接从模型结构中提取出清晰的因果路径往往非常困难。例如,即使一个ANN能准确预测某个医疗干预对病人健康的影响,我们也难以直接从其复杂的权重和层级中辨识出是哪个具体的生物学通路或社会经济因素发挥了关键的因果作用。

2. 数据本身的特点与挑战

虽然机器学习在处理海量、高维度、非结构化数据方面优势显著,但经济学数据,尤其是微观计量领域的数据,往往具有其特殊性:

数据量并非总是“海量”: 尽管在大数据时代,很多经济学研究能够获取的数据量在增加,但很多高质量的、专门设计的微观层面的实验数据或调查数据(如劳动力调查、家庭健康调查)在样本量上并非无穷大。在样本量有限的情况下,复杂的ANNs更容易过拟合,导致模型在训练集上表现优异,但在新样本上泛化能力差。
结构化与稀疏性: 经济学中的大多数数据是结构化的,包含明确的变量定义和观测值。虽然存在文本数据(如招聘广告、医疗记录)可以从ML的角度进行处理,但核心的经济变量(收入、支出、就业状态、健康指标)通常是结构化的。此外,很多经济学变量之间可能存在稀疏的联系,或存在明显的行业、地域、制度等“固定效应”,这需要模型能够有效地捕捉和控制这些结构化信息,而ML模型有时需要额外的设计才能很好地处理这些。
因果结构的存在: 经济过程本身往往蕴含着一定的因果结构,即使这些结构是非线性的。经济学家更倾向于构建能够反映这些已知或假设因果结构的模型,而不是完全开放式的“黑箱”模型。例如,在分析教育对收入的影响时,我们可能先假设一个收入的生成函数,其中教育是关键的内生变量,并使用相应的工具变量法来处理教育内生性。
数据质量与测量误差: 经济学数据常伴随测量误差、遗漏变量、选择性偏差等问题。虽然ML模型在一定程度上可以容忍噪声,但经济学计量方法在处理这些问题上有成熟且理论支撑完整的工具箱。将ML模型与这些传统的纠偏技术结合,或者用ML来改进纠偏过程,是当前研究的一个方向,但直接替代则是另一回事。

3. 传统计量经济学工具的强大生命力与兼容性

传统计量经济学在过去几十年间积累了非常丰富的理论和方法,并且这些方法不断发展,也在一定程度上吸收了ML的思想。

成熟的理论框架: 最小二乘法(OLS)、广义矩估计(GMM)、最大似然估计(MLE)、面板数据模型、时间序列模型等,都有坚实的统计学和经济学理论基础。它们提供了对估计量性质(如无偏性、一致性、渐近正态性)的深入分析,以及模型诊断、假设检验的丰富工具。
可解释性与因果推断的优势: 上文已提及,传统方法在解释模型参数的经济含义、进行因果推断方面具有天然优势。例如,一个线性回归模型中的某个系数,可以直接解释为在控制其他因素后,该变量每变化一个单位,目标变量平均变化多少。
对ML方法的借鉴与融合: 并非经济学完全排斥ML。事实上,很多研究者在积极探索如何将ML方法融入传统计量框架,或将传统思想注入ML模型。
正则化技术: LASSO、Ridge回归等L1/L2正则化技术,本质上是引入了约束,以防止过拟合并实现变量选择,这与经济学中对模型简洁性和可解释性的追求相契合。
非参数与半参数方法: 核回归、局部加权散点图平滑(LOWESS)等非参数方法,以及部分参数模型,可以捕捉非线性关系,同时保留部分参数的可解释性,与ML中的一些思想相近。
ML用于数据预处理和特征工程: 机器学习技术可以用来处理缺失值、异常值,或者从高维数据中提取有用的特征,为后续的计量分析提供更好的输入。
ML用于模型选择与参数估计: 例如,使用交叉验证来选择最佳模型复杂度,或者使用ML方法(如支持向量回归)来估计复杂的模型参数。
因果森林(Causal Forests)、Double Machine Learning等: 这些是近年来非常热门的研究方向,它们结合了ML的强大预测能力和因果推断的需求,试图在复杂的、非线性的环境中估计平均处理效应(ATE)或条件平均处理效应(CATE)。这类方法正逐渐被经济学界接受和应用。

4. 研究者的技能与研究范式的转变

技能门槛: 深度学习等ML算法的掌握需要一定的数学基础(线性代数、微积分、概率论)和编程技能(Python, R等)。虽然许多经济学博士生在这些方面都有一定的训练,但深入掌握ML算法的原理、实现和调优,仍然需要额外的投入。
研究范式的惯性: 经济学研究是一个成熟的学科,拥有自己的一套研究范式、期刊审稿标准和学术评价体系。新的方法和工具需要时间来被证明其价值,并在学术共同体中推广开来。许多顶尖期刊的审稿人更熟悉并倾向于接受基于成熟计量方法的论文,这也在一定程度上减缓了ML方法的普及。
对“硬”科学的模仿: 经济学作为一门社会科学,有时会借鉴自然科学的研究方法。但与物理、化学等有明确“正确”答案的领域不同,经济学研究的是人类行为和社会系统,这些系统本身就充满了不确定性、非理性和动态变化。ML在处理模式识别和预测方面的优势,在经济学中需要更谨慎地“翻译”为可解释的经济洞察。

5. 特定研究领域的考量

劳动经济学: 关注工资决定、就业分析、技能差异、劳动市场摩擦等。研究者需要理解是什么因素(教育、经验、行业、地理位置、歧视等)导致了薪酬和就业的差异,以及政策(最低工资、失业救济、税收)的具体传导机制。仅仅一个高预测精度的黑箱模型,很难回答“为什么男性比女性平均薪酬高”或“如果大幅提高失业救济金会不会降低劳动供给”这类问题。
卫生经济学: 关注医疗服务的使用、健康保险、医疗技术评估、疾病预防效果等。研究者需要理解是什么原因导致个体或家庭在医疗上的支出和健康状况的差异,以及医疗政策(如医保报销比例、公共卫生项目)的成本效益和对行为的影响。例如,要评估一项新的健康检查项目是否有效,不能只看预测的健康改善程度,还需要理解是哪些具体因素(如早期发现、行为改变)驱动了这种改善,以便将其推广到更广泛的人群。

总结来说,经济学(劳动、卫生等应用微观计量领域)没能广泛应用人工神经网络算法等机器学习算法,主要是因为:

研究目标导向: 经济学更强调对经济现象的“理解”和“因果解释”,而非单纯的“预测”。“黑箱”模型在这方面存在根本性限制。
数据特性: 经济学数据虽然数量增加,但结构化、包含已有理论框架的特点,以及对因果结构的关注,使得传统计量方法和结合了因果推断的新方法更具优势。
方法论的成熟度与兼容性: 传统计量经济学方法拥有坚实的理论基础和丰富的工具箱,并且在不断发展,积极吸收ML的思想,通过融合而非完全替代的方式来解决问题。
技能与范式: 新方法的学习和应用需要时间和投入,学术共同体的接受也需要过程。

但这并非意味着ML在经济学中没有未来。恰恰相反,我们正在见证ML方法(特别是那些能解决因果推断问题的ML方法)与经济学计量方法的融合,这为经济学研究带来了新的可能性和更强大的工具。未来,更具解释性和因果导向性的ML技术,以及经济学家对ML方法的深度理解和创造性应用,必将推动经济学研究的进一步发展。

网友意见

user avatar

克拉克奖获得者苏珊.阿瑟说过一句话就可以概括了:神经网络的预测能力强,但是解释力差,而传统计量的解释力强,预测力弱。工程重预测,经济学重解释。

题主说一定要有模型,这个倒未必,很多计量也可以是探索性的,自变量因变量设定一下,先跑一个线性回归看看显著性,很多研究都这么开始的。但是计量的好处在于,回归结果出来之后,不管解释了因变量变化的百分之几,但是估计值就在哪里放着,哪个变量显著,哪个变量不显著,哪个变量更重要,可谓是一目了然。然后我们就可以或者用现有理论来解释回归结果,或者提出新的解释。


但是神经网络高度非线性,往往就是把参数输入进去,然后输出一个预测结果,一般来说,我们比较的是预测的精度,预测越准,我们认为这个算法越好。但是经济学家需要回答的是为什么。因为高度的非线性,各种参数之间在神经网络内部互相纠缠,我们只知道最后的结果是好的,但是无法把这个预测掰开了,揉碎了告诉大家,分别来自于哪个参数的作用。


在工程上,往往需要的是结果,所以预测准就够了,就能够用来开发诸如在线推荐系统等等基于机器学习的应用了,但是经济学需要的解释经济现象背后的原理,为什么这么准呢?目前还是需要用经典的计量来解释更有效。


苏珊.阿瑟本人有计算机本科学历的背景,对机器学习的各种比较工程的方法不排斥,并且在联通机器学习和计量经济学方面做了很多的工作。有兴趣去她的主页看看:Susan Athey

比如这篇文章 Machine Learning for Estimating Heretogeneous Casual Effects 就很有意思。

类似的话题

  • 回答
    经济学,尤其是劳动、卫生等应用微观计量领域,在拥抱机器学习(ML)特别是人工神经网络(ANNs)等深度学习算法方面,确实比许多其他科学领域显得更为审慎和缓慢。这并非技术上的不可逾越,而是深植于经济学研究的固有逻辑、数据特征以及研究者对模型可解释性和因果推断的极致追求。下面我将从几个关键角度,详细剖析.............
  • 回答
    2021年的诺贝尔经济学奖,奖给了三位在劳动经济学和因果关系分析领域做出杰出贡献的经济学家:David Card、Joshua Angrist和Guido Imbens。他们的研究成果,不仅仅是对经济学理论的深化,更是为我们理解和解决现实社会中的各种复杂问题提供了强有力的工具和深刻的洞察。David.............
  • 回答
    “996”现象,这个在中国互联网行业一度甚嚣尘上的工作模式,就像一个放大镜,将市场供需的残酷博弈、企业的生存逻辑以及劳动者权益的困境,以一种极度压缩的方式展现在公众面前。要理解它,我们得抽丝剥茧,从几个经济学和管理学的视角深入剖析。一、 市场供需的“失衡”与“扭曲”:为什么会有996?从最基础的市场.............
  • 回答
    劳动参与率透视:美国就业市场复苏的“晴雨表”与未来经济的“预判器”美国就业市场的复苏进程,从来不是一个简单的数字游戏。在经济学家们引以为傲的各类指标中,“劳动参与率”无疑是最能触及就业市场深层脉络的“晴雨表”。它不仅仅是衡量有多少人有能力且愿意工作,更是洞察经济活力、潜在增长以及未来发展走向的关键窗.............
  • 回答
    “中国经济出现了不正常的资本替代劳动的倾向”这个观点是相对普遍且有一定事实依据的,但说“不正常”则需要更 nuanced 的分析。 让我们详细探讨一下这个观点。什么是资本替代劳动?资本替代劳动是指在生产过程中,企业更多地投资于机器、设备、自动化技术等资本要素,而不是增加雇佣的劳动力。换句话说,一个单.............
  • 回答
    “机器最终取代人工劳动”是一个极具前瞻性的设想,但如果真的发生,仰仗人力资源的中国经济确实面临严峻的挑战,甚至可能出现结构性的崩溃。然而,“崩溃”是一个强烈的词语,实际情况可能会更加复杂,涉及转型、适应和新的经济模式的出现。下面我将从多个维度详细阐述这个问题:一、 中国经济高度依赖劳动力的现状:1..............
  • 回答
    为了更深入地探讨“更好地保护劳动者对经济发展有什么不利之处”,我们需要剖析其可能产生的负面影响,并尽量避免使用过于生硬或公式化的语言,而是采用更贴近实际观察和分析的叙述方式。首先,从企业运营成本这个角度来看,更强的劳动者保护往往意味着企业需要承担更高的成本。比如,更严格的安全生产标准,虽然是保障员工.............
  • 回答
    这确实是一个很有趣的问题,也触及到了文化复兴运动中一些复杂而微妙的方面。要理解为什么会出现这种双重标准,我们需要从几个层面来剖析:1. 历史语境与复兴动机的差异: 汉服复兴的核心: 汉服复兴运动的倡导者,很大程度上是为了找回“失落的中华传统文化”的认同感。他们认为,在近代以来,特别是清朝之后的服.............
  • 回答
    这个建议,说实话,挺大胆的,也挺有意思的。让小学到研究生缩短两年,这可不是小事,它像是一颗投入平静湖面的石子,激起的涟漪会非常广泛,甚至可能改变很多事情的流向。首先,我们得承认这个建议的初衷是好的,甚至可以说是非常现实的。 经济发展需要新鲜血液,需要有能力、有技能的劳动力。教育年限太长,意味着很多人.............
  • 回答
    在探讨马经中商品的价值是如何决定的问题时,我们首先要理解马克思经济学理论的基石——劳动价值论。按照马克思的分析,商品的交换价值,也就是它能在市场上用来换取其他商品的量,最终是由生产该商品所耗费的社会必要劳动时间来决定的。这里需要强调几个关键点: 社会必要劳动时间: 马克思不是指任何一个生产者单独.............
  • 回答
    《经济学人》(The Economist)作为国际知名的英文媒体,其报道通常以中立、客观为原则,但其对特定议题的立场和角度可能受到其编辑方针、文化背景或政治倾向的影响。关于您提到的“《经济学人》采访赛雷后污蔑其为极端民族主义者,并高度赞扬回形针等”的报道,需要从以下几个方面进行详细分析: 1. 报道.............
  • 回答
    经济学是一门研究人类如何做出选择以应对稀缺性以及这些选择如何影响社会整体的学科。从这个角度来看,经济学本身当然可以用来赚钱,而且在很多方面是极其重要的赚钱工具。然而,“经济学用来赚钱”可以从几个不同的层面来理解,而经济学家们未能普遍成为巨富,也同样可以从多个角度来解释。 经济学是如何用来赚钱的?经济.............
  • 回答
    经济学博士开始自己的研究是一个系统而严谨的过程,它不仅仅是“想到一个问题然后写出来”,而是需要扎实的理论基础、敏锐的洞察力、严谨的方法论以及持续的努力。以下将从多个维度详细阐述经济学博士如何开始自己的研究:第一阶段:基础构建与方向探索 (通常在博士项目初期,尤其是第一年和第二年) 扎实的理论基础.............
  • 回答
    经济学在数理推导和经济直觉之间的平衡是一个复杂且持续演进的问题。很难简单地说经济学“越来越”重视哪一个,因为两者都是经济学研究不可或缺的组成部分,并且它们之间的关系是动态的、互相促进的。为了更详细地解释这一点,我们可以从几个维度来分析:一、 数理推导在现代经济学中的核心地位 严谨性和普遍性: 数.............
  • 回答
    经济学是否适合文科生?这是一个在学界和学生群体中都相当普遍的问题。答案并非简单的“是”或“否”,而是需要更深入的探讨。总的来说,经济学非常适合有逻辑思维、善于分析、对社会运行机制感兴趣的文科生,但需要克服一些固有的挑战。为了更详细地说明这一点,我们可以从以下几个方面来分析:一、 经济学与文科生思维方.............
  • 回答
    经济学是一门研究稀缺资源如何分配以满足人类无限需求的学科。许多经济学研究结果与我们日常生活中基于经验和常识的直觉相悖,这些“反直觉”的研究结果往往能揭示更深层次的经济运行规律。以下是一些比较典型且详细的例子:1. 价格上涨时,人们可能购买更多——“吉芬商品”(Giffen Goods) 普通人的.............
  • 回答
    好的,非常乐意为您推荐一些经济学入门的必读书籍。经济学是一个非常庞大且迷人的学科,入门时选择合适的书籍至关重要,它们能够帮助您建立正确的思维方式、理解核心概念,并激发进一步学习的兴趣。下面我将从几个不同角度为您推荐书籍,并尽可能详细地讲解它们的特点和适合人群: 推荐原则:在推荐书籍之前,我想先说明一.............
  • 回答
    经济学专业是否“鸡肋”是一个非常复杂的问题,它取决于很多因素,包括个人的学习态度、职业规划、院校的教学质量以及宏观的经济环境等。简单地将其归类为“鸡肋”是不准确的,但我们也可以深入分析为什么会产生这样的疑问,以及经济学专业在现实中的价值和局限性。为什么有人会认为经济学专业“鸡肋”?产生这种看法的原因.............
  • 回答
    “民科”通常是指非专业研究人员进行的、不遵循科学研究的严谨方法和规范的科学探索。它带有一定的贬义色彩,暗示其研究缺乏系统性、理论基础薄弱、方法不科学、结论不可靠等。那么,经济学是否属于民科呢? 从学术界的主流定义和普遍认知来看,经济学不属于民科,而是被广泛认可和研究的一门社会科学。 但理解这个问题需.............
  • 回答
    经济学是一门不断发展的学科,其前沿研究领域非常广泛且不断演变。为了更详细地阐述,我们可以从几个核心方向来解读当前经济学最前沿的研究:一、 行为经济学与神经经济学:理解真实的决策者传统经济学假设个体是理性的“经济人”,会做出最优选择。然而,现实中的人们往往受到心理、情感、社会因素的影响,决策过程并非总.............

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有