我是线性混合效应模型的新手,我正在尝试将它们用于假设检验。
在我的数据(DF
(中,我有两个分类/因子变量:color
(红/蓝/绿(和direction
(上/下(。我想看看这些因素的scores
(数值(是否存在显著差异,以及是否存在相互作用效应,同时考虑每个participant
的随机截距和随机斜率。
什么是合适的lmer
公式?
这是我的。。。
我的数据结构如下:
> str(DF)
'data.frame': 4761 obs. of 4 variables:
$ participant : Factor w/ 100 levels "1","2","3","4",..: 1 1 1 1 1 1 1 1 1 1 ...
$ direction : Factor w/ 2 levels "down","up": 2 2 2 2 2 2 2 2 2 2 ...
$ color : Factor w/ 3 levels "red","blue",..: 3 3 3 3 3 3 3 3 3 3 ...
$ scores : num 15 -4 5 25 0 3 16 0 5 0 ...
经过一些阅读,我认为我可以为参与者编写一个具有随机斜率和截距的模型,并且一个固定效果,如下所示:
model_1 <- lmer(scores ~ direction + (direction|participant), data = DF)
这为我提供了direction
的固定效应估计和p值,我认为这是对direction
对scores
影响的有意义的评估,而参与者之间的个体差异被视为随机效应。
但是,我如何添加我的第二个固定因子color
和一个交互项,同时仍然为每个参与者提供随机截距和斜率?
我想也许我可以这样做:
model_2 <- lmer(scores ~ direction * color + (direction|participant) + (color|participant), data = DF)
但最终我真的不知道这个公式到底意味着什么。如有任何指导,我们将不胜感激。
您可以通过至少两种方式包括几个随机斜率:
-
您的建议:估计两个预测因子的随机斜率,但不估计它们之间的相关性(即假设不同预测因子的随意斜率不相关(:
scores ~ direction * color + (direction|participant) + (color|participant)
-
相同但也估计了不同预测因子的随机斜率之间的相关性:
scores ~ direction * color + (direction + color|participant)
请注意两件事:
首先,在这两种情况下;参与者";以及每个随机斜率和随机截距之间的相关性。除非你有相反的理论理由,否则这可能是有道理的。如果您想避免随机截距和斜率之间的相关性,请参阅此有用的摘要。
其次,在这两种情况下,交互项都不包含随机斜率!如果交互效应实际上是你感兴趣的,你至少应该尝试为其拟合一个具有随机斜率的模型,以避免固定交互效应中的潜在偏差。在这里,您可以再次选择允许或避免交互项的随机斜率与其他随机斜率之间的相关性:
没有相关性:scores ~ direction * color + (direction|participant) + (color|participant) + (direction:color|participant)
具有相关性:scores ~ direction * color + (direction * color|participant)
如果你没有理论基础来决定随机斜率之间有相关性还是没有相关性的模型,我建议你两者都做,将它们与anova()
进行比较,然后选择更适合你的数据的模型。