首页

请问为什么多元估计中系数的方差比单变量估计的方差大，但是我们还是偏爱多元估计的系数呢？第1页

wu-zhi-zhe-17 网友的相关建议:

正好2年前学过这个，为解决这个问题，先介绍一个定理：

Frisch-Waugh-Lovell Theorem

If the regressors are partitioned as in , then:
1. If and are the OLS regression coefficients in the regression

, then

and

where and .这里的就是线性回归里面的projection matrix.

2. The residual

这个定理的证明主要是用到一些分块矩阵的知识，暂且不表，主要是用它来说明一下问题。

现在我们假设我们真实的full model是以下形式：

记这个model的OLS estimator为 , 其中 OLS estimate 是的无偏估计(根据 Gauss-Markov 定理), 的variance则是 (根据Frisch-Waugh-Lovell 定理).

再假设我们实际使用的是一个更简单的resitrcted model：

记这个model的OLS estimator为 , 那么它的期望则是

它的方差则是 .

显然，只有当 (即对不起作用)或者 (即和正交)的时候，才是无偏估计，否则是的biased estimator.

而对于方差而言，因为是个semidefinite positive matrix，所以理论上说的方差要大于 .

但实际估计的时候有一个问题，就是的值我们是不知道的，所以也需要把它估计出来. 记full model的residual是 , 的estimate是 ; restricted model的residual是 , 的estimate是 .那么我们可以通过Frisch-Waugh-Lovell 定理得到以下结论：

因此， . 而

， ，因此二者的大小关系无法确定，还取决于 的值。

综上所述，虽然理论上讲，的方差要小于 , 但因为我们估计的方差则是 , 方差则是 , 所以实际上empirically这个比较的结果是不确定的，它取决于sample size T的大小，regressors的个数，以及和之间的关系。

不过我们还可以求一二者standard error的期望，分别是：

当时，我们有：

所以，如果很小而很大的时候，是很有可能的. 这事实上就是 @水寒龙猫那个回答里面simulation的情况

可能会有一些小问题，欢迎指出。

请问为什么多元估计中系数的方差比单变量估计的方差大，但是我们还是偏爱多元估计的系数呢？的其他答案点击这里