我读过的前门调整的证明分为三个步骤:
- Show P(M|do(X))是可识别的
- 显示P(Y|do(M))是可识别的
- 将P(M|do(X))和P(y|do(M))的do-free表达式相乘得到P(y|do(X))
其中Y,X,M满足前门调整的假设。符合这些假设的图是:
X->M;M->Y;U->X;U->Y
我知道我在这里是愚蠢的,但我不明白是什么理由简单地将表达式相乘得到p (Y|do(X))。
这就像说:
P(Y|do(X)) = P(Y|do(M)) * P(M|do(X))
(也许前门调整的假设是必要的),但我在因果推理的研究中没有认识到这一规则。
正式描述在像您所描述的具有中介和不可观察混杂因素的图中,路径X->M->Y是混杂的。然而,路径X->M是无混杂的(Y是对撞机),我们可以通过控制X来估计M->Y。这样我们就得到了构成路径X->Y的两个因果量。对于具有任何类型因果函数的图,沿若干条边传播效应意味着组合描述每条边的函数。在线性函数的情况下,这仅仅相当于它们的乘法(线性假设在因果推理的上下文中非常常见)。
就像你说的,我们可以把它写成
P(M|do(X)) = P(M|X) # no controls necessary
P(Y|do(M)) = E_T(Y|X,T) # we marginalize out T
P(Y|do(X)) = P(M|do(X)) * P(Y|do(M)) # composing the functions
直觉:整个"把戏"前门程序的优点在于认识到我们可以将沿多个边的因果路径的估计分解为对其分量的估计,这可以在不进行调整(在我们的情况下为X->M)或使用后门准则(在我们的情况下为M->Y)的情况下解决。然后,我们可以简单地组合各个部分,以获得整体效果。
这个视频也给出了一个很好的解释。