百科问答小站 logo
百科问答小站 font logo



请问为什么多元估计中系数的方差比单变量估计的方差大,但是我们还是偏爱多元估计的系数呢? 第1页

  

user avatar   wu-zhi-zhe-17 网友的相关建议: 
      

正好2年前学过这个,为解决这个问题,先介绍一个定理:

Frisch-Waugh-Lovell Theorem

If the regressors are partitioned as in , then:
1. If and are the OLS regression coefficients in the regression

, then

and

where and .这里的 就是线性回归里面的projection matrix.

2. The residual

这个定理的证明主要是用到一些分块矩阵的知识,暂且不表,主要是用它来说明一下问题。

现在我们假设我们真实的full model是以下形式:

,

记这个model的OLS estimator为 , 其中 OLS estimate 是 的无偏估计(根据 Gauss-Markov 定理), 的variance则是 (根据Frisch-Waugh-Lovell 定理).

再假设我们实际使用的是一个更简单的resitrcted model:

,

记这个model的OLS estimator为 , 那么它的期望则是

,

它的方差则是 .

显然,只有当 (即 对 不起作用)或者 (即 和 正交)的时候, 才是无偏估计,否则 是 的biased estimator.

而对于方差而言,因为 是个semidefinite positive matrix, 所以理论上说 的方差要大于 .

但实际估计的时候有一个问题,就是 的值我们是不知道的,所以也需要把它估计出来. 记full model的residual是 , 的estimate是 ; restricted model的residual是 , 的estimate是 .那么我们可以通过Frisch-Waugh-Lovell 定理得到以下结论:

因此, . 而

,因此二者的大小关系无法确定,还取决于 的值。

综上所述,虽然理论上讲, 的方差要小于 , 但因为我们估计的 方差则是 , 方差则是 , 所以实际上empirically这个比较的结果是不确定的,它取决于sample size T的大小,regressors的个数,以及 和 之间的关系。

不过我们还可以求一二者standard error的期望,分别是:

当 时,我们有:

所以,如果 很小而 很大的时候,是很有可能 的. 这事实上就是 @水寒龙猫 那个回答里面simulation的情况

可能会有一些小问题,欢迎指出。




  

相关话题

  学统计学的大神有哪些? 
  楚霸王项羽真的在乌江被困时一人斩杀了几百人吗? 
  层次分析法中,建立判断矩阵时,可不可以用1——5这五个数字表示两两比较的重要程度? 
  如何解释探索性因素分析? 
  两个无偏估计量的方差可能相等吗?如果可能相等,那么此时怎么判断哪个更好呢? 
  因果推断(causal inference)是回归(regression)问题的一种特例吗? 
  请问为什么多元估计中系数的方差比单变量估计的方差大,但是我们还是偏爱多元估计的系数呢? 
  简明易懂的大样本理论(asymptotic/large sample theory)的教材? 
  请问假设检验(hypothesis testing)的意义到底是什么,它的原理是什么样的? 
  大数定律具体是个什么概念? 

前一个讨论
如何评价《“墨茶事件”过度的炒作,是社会负能量,是价值观的扭曲!》这篇文章?
下一个讨论
出国选老板都跟正教授大牛,那谁跟助理教授?





© 2024-11-22 - tinynew.org. All Rights Reserved.
© 2024-11-22 - tinynew.org. 保留所有权利