百科问答小站 logo
百科问答小站 font logo



请问为什么多元估计中系数的方差比单变量估计的方差大,但是我们还是偏爱多元估计的系数呢? 第1页

  

user avatar   wu-zhi-zhe-17 网友的相关建议: 
      

正好2年前学过这个,为解决这个问题,先介绍一个定理:

Frisch-Waugh-Lovell Theorem

If the regressors are partitioned as in , then:
1. If and are the OLS regression coefficients in the regression

, then

and

where and .这里的 就是线性回归里面的projection matrix.

2. The residual

这个定理的证明主要是用到一些分块矩阵的知识,暂且不表,主要是用它来说明一下问题。

现在我们假设我们真实的full model是以下形式:

,

记这个model的OLS estimator为 , 其中 OLS estimate 是 的无偏估计(根据 Gauss-Markov 定理), 的variance则是 (根据Frisch-Waugh-Lovell 定理).

再假设我们实际使用的是一个更简单的resitrcted model:

,

记这个model的OLS estimator为 , 那么它的期望则是

,

它的方差则是 .

显然,只有当 (即 对 不起作用)或者 (即 和 正交)的时候, 才是无偏估计,否则 是 的biased estimator.

而对于方差而言,因为 是个semidefinite positive matrix, 所以理论上说 的方差要大于 .

但实际估计的时候有一个问题,就是 的值我们是不知道的,所以也需要把它估计出来. 记full model的residual是 , 的estimate是 ; restricted model的residual是 , 的estimate是 .那么我们可以通过Frisch-Waugh-Lovell 定理得到以下结论:

因此, . 而

,因此二者的大小关系无法确定,还取决于 的值。

综上所述,虽然理论上讲, 的方差要小于 , 但因为我们估计的 方差则是 , 方差则是 , 所以实际上empirically这个比较的结果是不确定的,它取决于sample size T的大小,regressors的个数,以及 和 之间的关系。

不过我们还可以求一二者standard error的期望,分别是:

当 时,我们有:

所以,如果 很小而 很大的时候,是很有可能 的. 这事实上就是 @水寒龙猫 那个回答里面simulation的情况

可能会有一些小问题,欢迎指出。




  

相关话题

  简明易懂的大样本理论(asymptotic/large sample theory)的教材? 
  条件概率属不属于随机变量?为什么? 
  如何理解“均方位移MSD”这个概念? 
  去哪找数据?怎么挖掘? 
  中国现在的堕胎率是多少 有统计过吗? 
  因素分析、熵值法的用法区别是什么? 
  为什么样本协方差Cov(X,Y)中自由度为n-1,而相关系数的假设检验自由度为n-2? 
  如何零基础自学SAS? 
  PhD念得不愉快怎么办? 
  如何看待 2020 年美国大选期间,多个民调机构预测出现严重失误? 

前一个讨论
如何评价《“墨茶事件”过度的炒作,是社会负能量,是价值观的扭曲!》这篇文章?
下一个讨论
出国选老板都跟正教授大牛,那谁跟助理教授?





© 2024-11-25 - tinynew.org. All Rights Reserved.
© 2024-11-25 - tinynew.org. 保留所有权利