问题

如何看待国内经济学研究中reduced form的应用微观实证研究泛滥?

回答
国内经济学研究中Reduced Form 应用微观实证研究泛滥现象的深入剖析

近年来,国内经济学研究中,以Reduced Form为核心的微观实证研究呈现出一种“泛滥”的态势。这种现象并非全然负面,它确实极大地推动了中国经济学研究在实证层面的进步,尤其是在政策评估和因果关系推断方面。然而,正如任何一种研究方法或趋势一样,当其过度发展时,也可能伴随着一些潜在的弊端和挑战。

要深入理解这一现象,我们需要从多个维度进行剖析:

一、 Reduced Form方法的兴起及其优势

首先,理解Reduced Form在经济学研究中的地位至关重要。Reduced Form,中文常译为“约简式”或“简式”,在计量经济学中通常指通过一系列数学推导和经济理论的简化,将一个复杂的、包含多重内生性变量的模型,直接表达为某个政策变量或解释变量与被解释变量之间直接的因果关系。其核心目标是回答“X对Y的影响有多大?”这类问题,而无需直接估计模型中所有潜在的结构性参数。

Reduced Form的优势在于:

强大的因果识别能力: 在存在内生性(例如遗漏变量、同时性、选择偏差)的情况下,结构性模型往往难以直接估计出可靠的因果效应。Reduced Form方法,如工具变量法(IV)、断点回归(RDD)、双重差分法(DID)、匹配法(Matching)等,能够巧妙地利用外生冲击、政策变化、自然实验等外部信息,绕过内生性问题,相对清晰地识别出政策或变量的平均处理效应(Average Treatment Effect, ATE)或特定人群的平均处理效应(Average Treatment Effect on the Treated, ATT)。
政策评估的直观性: 政策制定者往往最关心的是某项具体政策的实施效果,例如提高最低工资对就业的影响,或者一项教育补贴对学生成绩的影响。Reduced Form方法能够直接量化这些政策的“效应大小”,为政策评估和制定提供直接证据,更易于理解和应用。
适应中国经济的转型特点: 中国经济发展过程中充满了各种改革、试点和政策调整,这些“准实验”或“自然实验”为应用Reduced Form方法提供了丰富的素材。例如,区域性试点政策、政策窗口期变化、地理因素等都可以作为识别工具。
研究方法的普及和技术门槛降低: 随着计量软件(如Stata、R)的不断发展和相关教程的普及,应用这些因果推断方法的技术门槛相比复杂的结构性模型有所降低,使得更多研究者能够进行实证分析。

二、 国内经济学研究中Reduced Form微观实证研究“泛滥”的表现

“泛滥”一词在此处可能带有一定的褒贬色彩,但从客观描述上看,可以体现在以下几个方面:

1. 研究主题的集中化: 许多研究将研究对象集中在政策评估、劳动力市场、教育、健康、金融市场微观行为等领域,这些领域更容易找到具有“实验性”或“准实验性”的政策或数据。
2. 方法论的趋同: 大量研究不约而同地采用双重差分(DID)、断点回归(RDD)、工具变量(IV)等主流的Reduced Form方法,并围绕着识别策略的有效性进行论述。
3. 对研究问题的“外生化”追求: 为了能够应用Reduced Form方法,一些研究可能会刻意寻找能够带来“外生冲击”的研究问题,或者将研究重点放在那些政策干预痕迹明显、数据相对容易获取的领域。
4. 论文发表导向: 部分高校和研究机构在评价研究成果时,对高水平期刊上发表的微观实证研究(尤其是应用了因果推断方法的研究)给予高度重视,这也会引导研究者倾向于此类研究。
5. 学生论文的批量生产: 在研究生教育中,应用型实证研究是培养学生研究能力的重要方式,但如果指导不当,也可能导致大量“套用模板式”的Reduced Form研究出现。

三、 “泛滥”现象背后的原因分析

“泛滥”并非空中楼阁,其背后有着多重驱动因素:

1. 中国经济的实际需求: 中国经济正处于高速转型时期,各种改革措施层出不穷,政策效果的评估变得尤为重要。政府、企业和学术界都需要了解各项政策的实际影响,Reduced Form方法恰好能提供这些证据。
2. 学术界对因果推断的重视: 国际经济学界近年来对因果推断的关注度持续提升,尤其是在诺贝尔经济学奖颁发给在因果推断方面做出贡献的学者后,这种趋势更加明显。国内学术界也积极跟进,推动了因果推断方法的研究应用。
3. 数据可得性的改善: 随着中国大数据、问卷调查、政府公开数据等渠道的不断丰富,微观层面的数据收集和整理变得更加容易,为进行实证研究提供了基础。
4. 研究范式的转移: 早期中国经济学研究可能更多侧重于宏观理论和描述性统计,而现在则更加强调基于数据和模型进行因果分析,Reduced Form方法是实现这一目标的重要工具。
5. “成功学”的示范效应: 许多在顶尖期刊上发表的研究都采用了严谨的因果推断方法,这为其他研究者提供了成功范例,也激发了大家模仿和学习的动力。
6. 对结构性模型的挑战和局限: 结构性模型虽然能提供更深层次的经济行为解释,但其建立过程复杂,对理论假设要求极高,且在动态、异质性强的中国经济环境中,常常难以精确刻画所有潜在变量和相互作用,导致模型结果可能存在偏差。Reduced Form方法相对而言更“接地气”,能直接回答“是什么”和“有多大”的问题。

四、 “泛滥”可能带来的潜在问题与挑战

尽管Reduced Form方法在因果推断方面功不可没,但“泛滥”也可能伴随一些负面效应:

1. “为方法而研究”的倾向: 部分研究者可能过于沉迷于使用新的或流行的因果推断方法,而忽略了研究问题本身的经济学意义和理论深度。研究的出发点变成了“有什么数据可以用某种方法分析”,而不是“有什么重要的经济问题需要用研究来解答”。
2. 过度依赖特定方法,忽视其他研究路径: 当一种方法“流行”时,研究者容易形成路径依赖,而忽视了其他同样重要或更适合特定问题的研究方法,如结构性模型、理论模型、定性研究等。
3. 忽略了研究的“内生性”: 即使Reduced Form方法旨在识别因果效应,但研究设计本身也可能存在潜在的内生性。例如,选择什么样的政策进行研究、选择哪个区域作为样本、选择哪一年作为政策实施的关键节点,这些选择本身也可能与研究结果相关。
4. 理论解释的薄弱: Reduced Form研究往往只关注政策的“效应大小”,而缺乏对这种效应背后机制的深入挖掘。其研究结果虽然能回答“是什么”的问题,但往往难以解释“为什么会这样”,这对于理论的进步和更深层次的经济洞察可能有所欠缺。例如,发现了最低工资上涨导致就业下降,但并未深入解释是哪个具体机制(如生产率提升、替代效应、规模效应等)在起主要作用。
5. “大数据杀熟”的风险: 如果研究者对数据的理解不够深入,或者对方法的适用条件不了解,就可能出现“大数据杀熟”的现象,即过度挖掘数据中的某些关联性,但这种关联性可能只是偶然的、不具有普遍的因果解释力。
6. 文献的同质化和可复制性问题: 当研究者扎堆研究相同的问题,使用相似的方法,且研究设计略有差异时,很容易导致文献的同质化。此外,如果研究者在数据处理和具体实现方法上存在细微差异,而这些差异又未被充分透明化,可能会影响研究结果的可复制性。
7. 对经济学理论的“去理论化”: 过度侧重于实证发现,而忽视了扎实的经济学理论基础,可能导致研究结果脱离了经济学理论的框架,缺乏解释力和指导意义。理论是研究的“灵魂”,而实证是“血肉”,两者不可偏废。
8. 政策反馈的局限性: 某些Reduced Form研究可能聚焦于特定时期、特定区域的政策效果,其结论的普适性和外推性可能受到限制。如果将这些结论直接推广到其他情境,可能会产生误导。

五、 如何应对和发展

面对这种趋势,关键在于如何平衡和发展,而不是一味否定:

1. 强化理论基础与研究问题的驱动: 研究应该始终以重要的经济学问题为导向,理论是解释和理解这些问题的框架。Reduced Form方法应该是解决问题的工具,而不是研究的全部目的。
2. 提升研究设计的严谨性: 在应用Reduced Form方法时,要更加关注研究设计的内生性问题,例如寻找更强的工具变量,更精确地界定断点,更合理地构建控制组和处理组,并进行多角度的稳健性检验。
3. 深入挖掘机制与结构: 在识别出因果效应后,更应进一步挖掘其背后的经济学机制,尝试构建能够解释这些机制的结构性模型,或者通过定性研究、访谈等方式补充解释性证据。
4. 拓展研究方法的多样性: 不能只局限于几种主流的Reduced Form方法,也要学习和应用其他因果推断方法,同时,也要关注结构性模型、理论分析、计算经济学等领域的研究,形成多元化的研究格局。
5. 加强学术交流与批判性思考: 学术界应鼓励对研究方法的深入探讨和批判,不盲目追捧流行方法,形成健康的学术生态。
6. 注重数据治理与开放: 提高数据的透明度和可获得性,方便研究者进行重复验证,同时也要加强对数据隐私和安全性的保护。
7. 培养研究者的综合能力: 教育体系应更加注重培养研究者的经济学直觉、理论功底、研究设计能力和批判性思维,而不仅仅是掌握某种计量方法。

结论

国内经济学研究中Reduced Form应用微观实证研究的“泛滥”,是特定历史时期、特定社会经济背景下多种因素共同作用的结果。它标志着中国经济学研究在实证化、因果推断方面取得了显著进步,但也提醒我们,任何一种研究方法的过度依赖都可能导致研究的片面化和理论的空心化。

未来的发展方向应该是,在继续发挥Reduced Form方法在因果推断上的优势的同时,更加注重研究问题的经济学深度、理论解释力以及研究方法的多元化和创新性,力求在实证证据与理论洞察之间取得更好的平衡,从而真正推动中国经济学研究的繁荣与进步。最终,我们的目标应该是生产出既有实证严谨性,又有理论深度和政策启示意义的优秀研究成果,而不是仅仅数量上的增加或方法上的堆砌。

网友意见

user avatar

稍微复杂一点的structure form需要的计量和计算的知识就很大了。

如果模型需要解一个博弈,那么博弈的解怎么快速用算法实现?有时候一个2x2的game,如果加入了game heterogeneity (X),研究者要解的可能就是上千个game的equilibrium,对于计算量复杂的MLE 来说,这可能是致命的。

接下来,如果你要做inference呢。很多structural model需要的计量工具都不是first year core 会讲到的。比如什么时候可以bootstrap,如何正确的bootstrap。

对于很多问题研究来说,这种复杂是得不偿失的。structural model的好处在于研究者可以做counterfactual,有很好的政策上的policy implication。而对于仅仅想解释x对y的影响,你更需要的是好的instrument而不是5-6页的结构模型。

user avatar

关于这个问题,我也思考过很久,到底什么时候用reduced form,什么时候用structural form,具体行为模型和纯统计分析方法到底如何结合。 仅仅是纯reduced form足够吗?我自己学到现在可以肯定的是,MHE是非常非常非常重要的(可以说最重要)应用微观教材,它背后的那套angrist和imbens提出的框架,也是最最基础的所有研究者必须掌握的工具。但是,要做研究,除非你是讲故事的天才,或者intuition超级无敌牛逼,不需要建模就可以发现自己研究中可能存在的问题及解决方案,否则只有MHE是绝对不够的。

这个问题我和我的老板Ronni Pavan,还有madison的chao fu老师都有过深谈,先把坑占了,有空了再具体写写我的感受。


两位老师给出的建议都是,不同的问题,不同的研究目标,要选用不同的方法。


reduced form的优点在于,1. 直观,能够迅速得到想要的某组因果关系;2. 模型估计假设要求少,因为我们在进行所谓的reduced form的研究的时候,实际上就是在把一个复杂的经济过程和人类行为模型看成了黑箱。这样的话我们就不用impose复杂的模型行为假设了,尤其是当我们使用非参或者半参的方法时,我们所做的假设是很弱很弱的。


但是reduced form的缺点就在于,我们把这个过程看作了黑箱,就使得我们无法得到任何有关这组因果关系的具体实现机制的信息了。按我老板的话说,reduced form非常不“economics”,因为我们根本没有给予任何作用机制,也就是行为主体行动的解释。所以,当我们想要考察一个具体作用机制,那就必须impose更多的structure,更多的行为的经济环境假设。这就是structural approach能够补充reduced form的地方。我不是做经济史的,但是我个人感觉经济史数据偏少,目标大多是限定在因果关系本身,建模困难,所以大多用reduced form是有道理的。


再继续说说structural approach。Structural approach和reduced form最大的区别就在于,我们不再只考虑某一组因果关系本身,不再把行为人的决策过程和不同行为人之间的交互过程(及导致的市场均衡)看做一个黑箱,而是尝试着从最基础的行为人效用最大化开始建立关于整个决策过程的模型。这样做的好处有两个,1. 通过构建整个决策过程的模型,我们能分析一个因果关系的作用机制,而不仅是因果关系本身。我老板是个很structural的人,所以他一直觉得reduced form太偷懒,对于我们理解人的行为本身没有太多的助益,而经济学本身最重要的任务之一,就是探寻人的整个决策过程。如果我们永远局限于reduced form,那么其实就完全不需要经济学,只做一个统计学家就可以了。 2. 通过一个完整的决策模型(而不是纯粹的简约式模型),我们能做很多reduced form里无法做的counterfactual analysis,而这个对于具体的政策指导,有着极大的帮助。比如,考虑一个Colas(2017)里关于移民影响美国就业市场的例子。在Colas的这篇JMP里,他用structural approach建立了一个关于美国的就业市场如何通过国内迁移(domestic migration),平衡各地的劳动力,来作为对国际移民进入的反应的动态一般均衡模型。在这个大模型里,他考虑了一种counterfactual,假设美国政府通过了某一种Paid Visa Program,也就是说,有偿卖出美国工作签证,然后把这些收上来的签证费作为补偿返还给国内受到移民冲击的工人,这样的政策是否能提升国家的整体福利水平。这种比较复杂的counterfactual analysis,是reduced form所无法做的。只有构建出具体的关于行为人行为方式的模型,以及市场结构的模型,我们才能够分析类似的复杂政策。 3. 在应用上,我个人能够感受到,即便你个人只想做一个reduced form的分析,构建一个具体的结构模型,有助于理解reduced form relationship里可能存在的漏洞和问题(内生性)。


虽然看上去structural approach比reduced form逼格高很多,但是其实它的问题也比reduced form多很多。1. 在进行建模的时候,我们必须impose更多假设,尤其是如果想要用MLE来进行估计的话,就必须有关于unobservable的大量分布假设,比如logit里面的EV1,或者正态分布等等。这些unobservable的分布假设完全是从天而降没道理的,假设成某种形式完全只是为了模型好解或者好估计(比如EV1能推导出一个closed form的logit),同时这些假设也是无法验证的。这也是我对structural form最大的怀疑之处,因为我觉得这样的建模方式违背了科学研究最基本的一些方法论。我和fu老师也聊过这个问题,她说目前确实没有太好的办法解决,但是已经有了一些前沿研究在考虑这些unobservable分布的假设了。2. 更复杂的结构意味着模型更难解,更难估计。事实上,不要说识别并估计一个复杂的game了(一般稍微复杂一点的game就必须借助set identification或者均衡选择这种玄学的东西了),估计一个动态的古典模型都很困难,直到Rust(1987) 和 Hotz and Miller(1993) 提出了NFP算法或者用CCP近似解value function,我们才有了比较好的数值方法。


总的来说,structural approach需要更多的假设,但能reveal问题里更多的方面。但是为了能reveal问题更多的方面,你就只能以这更多的假设为代价。按fu老师的话说,这就是你必须pay的price。


当你仔细了解了两种方法的优缺点之后,才能够看菜下饭,根据自己的研究目标和研究课题,选取不同的方法。如果你只想要某组因果关系,reduced form就够了。



然后说一个chao fu老师给我的具体例子。

考虑一个简单的妇女劳动参与模型。我们现在希望研究,丈夫收入对妇女工作决策的影响。

c是消费,w是参与工作能获得的工资,y是每一期获得的固定收入(丈夫收入,妇女自己工不工作都有)。pa是表示是否工作的discrete choice,即,若i参与劳动市场则pa=1,反之pa=0. X代表控制的其他变量, 代表某个人固有的不可观测的preference。

对于简约式来说,我们要的只是一个CEF,也就是:

对于这个模型的估计,我们只需要非参的方法就可以。

如果我们简单假设线性概率模型,那就变成了一个我们最常见的回归:

在这里,我们没有给予任何有关丈夫收入对女性劳动选择的作用机制的解释,而是把它看成了一个黑箱,用纯统计学的方法,靠某种外生冲击(或者试验),去识别 . 我们能在很少的假设下,得到比较robust的关于某种平均处理效应的结论(如用Angrist的方法,通过非参估计得到的LATE)。但是研究到这里就结束了,没有更多的东西了。

假设我们写出行为人的具体模型,以偏好和一个简单的partial equilibrium为primitive,我们就可以构造一个更复杂的行为结构,一个structural model。

然后我们通过解这个模型,可以得到

这是一个最简单的典型的discrete choice model的潜变量表达形式。

如果我们假设 在人群中的分布是EV1,那就能得到一个logit模型。

之后再通过MLE就可以进行估计了。但是要注意,如果想估计这个模型,就必须给 某一个分布的假设,EV1也好,正态分布也好。这就是你为更复杂的结构而付出的代价之一。




参考资料:

John Rust(1987) Optimal Replacement of GMC Bus Engines: An Empirical Model of Harold Zurcher, ECMA

Joseph Hotz and Robert Miller(1993) Conditional Choice Probabilities and the Estimation of Dynamic Models, REStud

Mark Colas(2017) Dynamic Responses to Immigration, JMP

Chao Fu's Slides

user avatar

举一个简单的例子来澄清一下吧。

假设某个变量 由 , , 三个因素决定,并且它的真实决定式是 。Take log,我们得到 。


  • Structural form 的搞法:先构建理论,尝试还原出上式,再估计出 和 (primitive parameters)。


  • Reduced form 的搞法:比方说你手中只有数据 和 ,好在现实中发生了一个外生冲击(政策变化,技术变化,自然灾害,等等),假设环境能够维持 恒定,冲击只通过改变 来影响 。于是,我们不必构建理论,直接 regress on ,可以得到 。我们同样可以估计出 。


  • 比较:可以看到,reduced form 里, 是 的系数,但 到底是个什么玩意呢? 我们只知道它是 , 的某种组合,但并不知道最底层的 和 到底是怎么影响 的。当然,有的学者可能会直接把 作为 或 的代理变量。这么做对不对呢?不妨开一下上帝视角。如果我们只关注 和 的关系,这时以 作为 的代理,你会发现,reduced form 和 structural form 的搞法其实是等价的。如果我们关注 和 的关系,且用 作 的代理变量,这时估计的结果就是错的。除此以外,reduced form 的另一个局限性是:比方说,几年后,经济环境改变了, 不再保持恒定了,我们再用一次 reduced form 估计出来的 也是错的(这就是所谓的卢卡斯批判)。


既然如此,structural form 总是更优的咯?

未必。

在现实中,其实我们常常写不出 的决定式来。即便能够做出预测力还算可以的结构模型,也要费时甚久。这时,reduced form 就是退而求其次的选择。

还记得我们上面提到过,在一些特殊情况下,reduced form 能够得出和 structural form 等价的结果吗?这就是以《基本无害的计量经济学》为代表的简约学派所追求的目标。


所以,很难直接比较 structural form 和 reduced form 到底谁好。

Structural form 直面问题的本质,它的结果看起来更加权威和规范,但也有可能你设定出来的 theoretical basis 根本就是错的。此外,结构方法非常 time-consuming。

Reduced form 一开始就放弃去打开黑箱,而是另辟蹊径,希望借助足够强的外生冲击,间接识别出关键系数来。这样,问题就变成你的 IV 到底够不够好。

我不认为经济学界存在 reduced form 泛滥的问题。认识事物总是要经历由浅入深的过程。如果打开黑箱的难度太大,reduced form 就是早期探索中更灵活的替代选择。一般来说, reduced form 做的足够多了,对这个问题的讨论足够充分了,下一步理论经济学家才会开始尝试去 generalize,从而转到 structural form 的路线上去。

user avatar

正好前段时间上了微观计量大牛Arthur Lewbel的讲座课,另外我导师组内目前也存在题主提出的“费时费力”整理数据库的状况,所以针对题主的问题谈一些理解。

第一,Reduced Form不仅在经济史领域是潮流,在其他经济研究领域也是潮流。因为计量在本质上是要实现“识别”(Identification)问题。在研究中,我们对济规律的理解,可以抽象成一个具体的模型(Model),而识别问题也就是通过我们可以观测到的数据(Observation),准确的估计出模型的参数。Reduced Form的好处其他答案已经说了很多,我认为最关键的思想在于,在保证处理措施(Treatment)具有随机性(Randomness)的基础上,Reduced Form在建模环节对经济结构施加了最小程度的假设,因此不会像Structural Model一样容易出现系统性的模型错误,而Treatment的随机性保证了对照组和实验组的可比性,从而保证了结果的可信性。那么,Reduced Form就相当于是,在放弃了对经济结构性规律进行揭露的同时,把现实数据中所反映的真实规律识别出来。所以,Reduced Form背后其实是关于经济理论建模、模型检验等问题的一种思想范式,那么它的流行也可想而知。

第二,根据课上和Arthur Lewbel的交流,Reduced Form其实可以用来检验Structural Form是否合理。就像第一点中讲的,Reduced Form回归得到的参数是现实数据中所反映的真实规律(实验组与对照组在Treatment后的真实差异),而Structural Form则是对经济规律施加了更多的结构性(方程组)假设,比如,认为经济变量之间是通过一个方程组的形式相互联系着的。而Reduced Form则把Structural Form中的所有传导机制合并压缩到一起了。所以SF的结果和RF的结果其实是可以在一定程度上相互比较的,毕竟Treatment和Dependent(我们关心的变量)都在模型中。如果结构模型出现了模型的错误设置,也就是说我们错误的理解了经济的内在规律,那么很可能用SF估计出来的总效应和RF估计的总效应会截然不同(比如,一正一负)。总体来说,SF野心更大,对理论的“信心”更大,所以错误的风险也大,如果模型是正确的,那么SF的结果应该和RF在可比范围内相近,否则说明模型设置存在问题。

第三,数据库要区分基础性数据库和针对专门问题的数据库。基础性数据库是一种公共品,比如大规模微观调查数据、统计年鉴、县志等,通常由专业部门进行供应;针对专门问题的数据库一般是特定研究者根据要研究的问题,在基础型数据库基础上,通过匹配等方式,增加一定数量的变量,使得一个“新的研究问题”可以有充分的数据加以解决,完成“识别”任务。我个人认为,整理专门性数据库是任何经济学研究者的必经之路。首先,新问题一般要求对数据进行补充,这是自然而然的;其次,可以类比企业进行R&D投资,实际上这种“龙穴里有太多龙”的问题是普遍现象,先到先得,企业率先创新则可以保留秘密或申请专利,科研率先创新可以发表论文,论文是一种信号,告诉其他人这个问题已经有人做过了,一定程度上减轻了题主所批判的问题;最后,其实每个新的领域都只有一小撮人在做,相互之间的关系比题主想象的要更透明一些。说到底,经济学本身就是研究资源配置的学科,在这个巨大的由经济学家组成的community里,演化出一定的合作机制,来尽可能的降低由于创新不确定性和投入重复性造成的浪费,应该是意料之中的。

类似的话题

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有