让我们假设,我有三个独立的分类变量e, f和g,并且想要估计因变量y。经过一些工作,我得出以下回归模型:
y = b0 + b1*x + b2*y + b3*z + b4(xy) + b5(xz)
如何确定不同类别/水平的x
是否存在总体显著性差异?由于b2
和b3
的项相等,我认为它们可能可以忽略。
根据我的理解,回归模型中的三个分类变量是x, y和z。我将把y重写为w,因为结果和变量都被标记为y。对于这篇文章,我指的是这个模型:
Y = b0 + b1x + b2w+ b3z + b4(xw) + b5(xz)
您在三个级别(xw, xz和wz作为参考)之间进行交互。
如果这是真的,那么就不能断言直接影响x和w的关系,为什么?因为列共线使得b1 b2和b3有偏估计。另一种思考方式是,x的影响取决于w(因此是相互作用)。
如果你想了解x对Y的直接影响(或W对Y的直接影响,z对Y的直接影响),那么你可以拟合一个没有相互作用项的模型。即符合
Y = b0 + b1x + b2w + b3z
,看b1的意义。该模型认为x对Y的影响与w或z无关。
因为你提到b2和b3近似相同,我建议另一种方法。您可以将w和z变量合并在一起(如果在科学上有意义的话),并仅使用x和合并的wz变量之间的交互项来拟合模型。
假设你需要交互项并想要传达x是如何影响y的,那么你可以选择有意义的协变量值并解释它如何改变结果。这种策略不再关注"意义",而是将注意力转移到解释和意义上。例如,如果x=1, w=0, z=0,对Y的影响为b1;如果x=1, w=0, z=1,则对Y的影响为b1 + b3 + b5,等等