我想研究两个自变量对一个因变量的影响。假设我们有X1 X2自变量和Y因变量。
我使用两种不同的方法。在第一种方法中,为了消除X1对Y的影响,我生成Y|X1的条件分布,并使用第二个变量X2进行回归。当我检查X2和Y|X1之间的相关性时,我得到了相对较高的相关性(R2>0.50)。然而,当我对大范围的数据(X1和X2)进行多元回归时,X2对Y的影响减小,变得不显著。这些方法是如何产生相互矛盾的结果的?对于给定的X1值,确定X2对Y的影响最合适的方法是什么?谢谢。
用数学符号表示上面的代码可能会很好。例如:你包括常数项了吗?
当:
Y = 0 + B1X1 + B2X2
这将是最容易检查的,B2可能会给你你想要的。
该模型仍然很简单,您可以探索如下内容:
Y = B0 + B1X1 + B2X2 + B3X1X2
或
Y = B0 + B1X1 + B2X2 + B3X1X2 + B4X1²+ B5X2²
看看系数是否有变化,是否有新的显著系数。
你可以进一步探索结构方程模型