从条件期望的角度理解比较方便。
假定我们关心的变量是Y,我们关注变量X对Y的影响是否显著,是何方向。我们已知一组变量W对Y有影响。
那么,“做回归”得到的是Y关于X和W的条件期望E[Y|(X,W)]。
你想的可能是,我们要得到X的效应,需要知道至少E[Y|X1,W1]和E[Y|X2,W1]这两个条件期望,然后做差并看看这个差是否具有统计上的显著意义才行。而事实上,在你得到了回归方程后,你可以在合理的值域内选择X和W的取值,考察上述差值。至于你的数据集中是不是真的包括(X1,W1)和(X2,W1)这两个因变量观测值,其实无所谓。更进一步,上述差值是否具有统计上的显著意义,和X前面的系数是否在统计上显著是等价的。