百科问答小站 logo
百科问答小站 font logo



能否用具体的例子解释一下 (Model-based) Structural Estimation? 第1页

  

user avatar   zhong-ze-min 网友的相关建议: 
      

这个问题很大,试着从IO角度来答一发,顺便复习下两年前学的东西。IO可以说引领了Structural的发展,比较有代表性。以下的例子基于经典的Bresnahan & Reiss在90年代初的几篇paper,包括90年RES和91年JPE等。

Entry问题简单来说是这样的:假设你是某种产品/服务的生产者,比如理发师。与你的无数个潜在的理发师同行一样,你们都面对着许多个市场(比如全国的各个社区)。你选择进入哪个市场的时候,要考虑市场需求,包括市场大小、弹性。另一方面,成本也很重要,包括边际成本如电费水费,和固定成本比如租金等。这些用来构造市场均衡的基本变量是如何决定的?这就是所谓模型的primitives。此外,注意到你的决策和你同行的决策是互相影响的,因此决策时需要考虑也包括有多少同行以及同行对竞争是如何反应的。这个competitive conduct也可以被model为一个primitive。

我们加一些假设来找均衡。假设如下:

  • 生产者都是同质的,成本一样,也就是说每个理发店都是一位理发师开的个体户;
  • 需求的弹性一样,只有市场大小(社区人口)区别;
  • 市场与市场之间是隔离的。

可以解出来均衡是这样的:社区人口直接决定了这个社区的理发店数量。打个比方,如果一个垄断的理发师每个月需要给1000人理发才能保证break-even(未来赚的全部利润在discount后能够支付固定成本),又假设平均每人每月理发一次,那么需要一个1000人的社区才能支持一家理发店开张。要想支持两家理发店,则至少需要2000人的社区。

看到这里,我们已经有了一个可以用来test的prediction:社区的理发店数量与人口有非常强的正相关。当然,在实际的数据中,还有无数的问题要解决。第一个问题就是得找到相对隔离的社区。然后是各个变量的measurement问题。比如人口是怎么度量的?只用现在的人口显然不行,需要考虑到对未来人口变化的预期。只考虑本社区的人口也不一定合理,说不定有旁边社区的人愿意走几步过来理发等等。又如收入不一样的地区很可能对理发服务的需求也不一样,需要控制。对因变量的测量也是个问题,因为实际上理发店很可能大小不一,大到几十上百位“老师”、“总监”,小到一位师傅一把剪刀支个摊。reduced-form model要做的就是在控制了其他所有因素的情况下,直接验证这个prediction。一个理想的实验是找到在各个方面都近似,唯有人口数量不一样的社区,看看理发店的数目,做一个简单的OLS。更复杂的情况下,可以考虑找人口数的IV,或者利用比如库区移民之类的外生冲击来做DiD,再或者看看有没有什么类似的政策导致社区人口数量的不连续变化从而做RD之类。

下一步我们还可以考虑理发师之间的竞争。前一段提到,如果需要1000人才能支持一个理发店,那么要想支持两家理发店,则至少需要2000人的社区。这个“至少”是很重要的,因为这是在两家理发店没有竞争,互相合谋定价时才能实现。如果两家店有竞争,那么势必导致价格和利润的下降,因而需要比2000人更大的市场才能支持这两家店的共存。通过比较数据中一家vs两家理发店的市场大小,我们的数据又能帮助我们理解理发师之间的竞争行为。假如你认为理发师之间确有竞争,那就有了另一个prediction:一个社区的人口数需要在(只有一家理发店的社区人口数)两倍以上时,才能支持两家理发店共存。同样,对这个prediction的验证也是可以通过reduced-form来完成。

(顺便提一下,另外一种可能性是两家理发店差异化,从而弱化了竞争,有可能反而不需要两倍人口。在卖车的例子中,BR1990 的发现就是Ford与GM dealer之间差异化的效应就超过了竞争的效应。)

那么Structuralist会怎么做呢?structural的想法是这样的,既然我用primitives可以解出均衡,并且用数据来验证均衡解,那为何不用数据来估计我的primitives呢?

具体来说,我们最感兴趣的参数有这几个。其一,是成本曲线(固定、边际成本)。其二,是需求曲线。其三,是competitive conduct,或者说竞争的激烈程度。下一步,则是看数据能够identify其中哪些参数。

(插一句无关话题,现在identification几乎成了exclusive restriction的同义词,其本意是模型参数能否由数据唯一决定。如果几套不同的参数能generate一样的数据,那这个模型就不是identified)

假设我们手头有社区人口(及几个其他可能影响市场大小的变量,如人口变化率)、收入、工资等可能同时影响需求与可变成本的变量、几个可能只影响固定成本的变量(比如租金),最后是模型的outcome variable即理发店数目。那么我们的目的就是用可观测的这些数据与模型的关系作为primitives,然后用均衡解来给出outcome,最后调整model的参数使得我们模型的解能够fit数据中理发店的数量。具体到这个理发店的entry model,我们最感兴趣的是成本曲线和competitive conduct。因此,我们对需求可以暂时不用model得特别仔细,在BR1990 RES paper中采取的办法是省去从需求和可变成本到均衡价格这一步,直接用人均利润作为潜在变量之一(它由收入等影响需求弹性和可变成本的变量决定,同时,根据市场中理发店是否垄断,还受到可能的竞争的影响,这些关系构成了模型的一部分primitives)。用市场大小作为潜在变量之二(由现有人口、周边人口、人口变化率决定,这是模型的另一部分primitives)。最后,加上固定成本作为第三个潜在变量(租金等如何决定它将成为模型最后一部分primitives)。最后我们需要一些error term,根据不同的model可以放在不同的地方。这里暂时不对它过多的处理,只是需要它来保证likelihood在任何参数都不为零以便于MLE的计算。根据每一套参数,我们都可以计算出这三个潜在变量,利用均衡条件可以解出理发店数目。用MLE等方法,我们可以不断迭代优化求解一套拟合最佳的参数,并且根据MLE的asymptotic性质得到standard error。

可以看出,这套思路和reduced-form是有所相通,但又很不相同的。具体到这个例子中,它在需求这一步其实已经部分的reduced-form了,因为它model的人均利润是个均衡下的结果,而非真正的效用、成本这样的primitive。不难看出,如果我们有更好的数据(如价格、销量等),那么更进一步的model是可能的(这也是structural IO / quantitative marketing最重要的工作之一demand estimation的内容)。但是整体看来,它和之前直接test model prediction的思路差别是显而易见的。

那么比较这同一个问题、同一数据的两种做法,各有何优劣呢?简单说几句。

  1. structural model无疑用了更强的假设。在reduced-form中test的hypothesis,虽然是在一定的假设下推导出来的,不难看出它很可能在弱得多的假设下也都成立。例如它不太依赖于具体的函数(比如说人口对市场大小的影响真的是线性的吗?租金对固定成本的影响又是何种形式呢?)和分布(error term真的是logit error吗?)等等。
  2. 但是,structural model也得到了"强"很多的结论。这个“强”的意思是信息量大很多。这些额外的信息量来源,一部分必然是从假设来的,但是另外一部分是对数据的更充分利用来的。reduced-form为了放宽假设,同时也会丧失一定的信息量,这个trade-off是不可避免的。reduced-form中的confounding factor,在structuralist看来可能恰恰是梦寐以求的exogenous variation。
  3. 至于structural model额外的信息量多有用,则是具体问题具体分析。structural model最大的吸引力之一就是可以做policy simulation,得到完全不在原来数据的自变量区间中有的信息。在这个问题上,我认为structural model额外得到的信息值得它额外的假设带来的代价。例如,如果有人对regulations感兴趣,想知道对理发店减税等等政策对理发店数量会带来什么影响,对消费者的福利又有什么影响,这是只有structural model能回答的问题。
  4. 现代的做法,对structural的paper一般都要先看所谓model-free evidence,然后再看模型的结果。所以并不太需要在这两种方法中做太多取舍。鱼和熊掌大可以兼得。作为学生,学好structural对reduced-form也是有益的。
  5. structural model往往比较delicate,所以在structural中犯错要比reduced-form中容易得多,做起来往往难度也大很多,coding和计算上的门槛也高一些(有些estimator收敛很慢,有些根本就不是global concave……)。

以上只是structural model非常早期的一个例子,权当抛砖引玉。最新的进展在模型和计算上都可谓日新月异,我也是刚刚接触不多,就不献丑了。

匆匆写完,望各位方家指正。




  

相关话题

  有哪些未来人工智能的职位适合经济专业? 
  GAN(对抗生成网络)可以被用于哪些(商业或潜在商业)实际问题? 
  为何澳洲的饮料价格小瓶大于大瓶? 
  如何看待共享单车集体涨价至 4 元每小时?从经济学角度看,共享单车每小时单位定价是多少最划算? 
  分类问题的label为啥必须是 one hot 形式? 
  加州大学伯克利分校为何能连续孵化出 Mesos,Spark,Alluxio,Ray 等重量级开源项目? 
  有哪些统计学专业反直觉的知识? 
  在与 AlphaGo(包括 Master) 的对局中是否出现了一些人类历史上从未想到过的着法、技巧? 
  未来五年中国有否发生系统性金融风险的可能,导火索会在什么方面? 
  早期的5个经济特区中,为什么只有深圳能够跻身一线城市? 

前一个讨论
如何看待 2018 年 1 月 2 日爆出的 Intel CPU 设计漏洞?
下一个讨论
有没有什么经济学模型可以解释羊群效应?





© 2024-12-25 - tinynew.org. All Rights Reserved.
© 2024-12-25 - tinynew.org. 保留所有权利