我想得到下面实验mat
的线性模型的拉丁方方程。
data <- c(12.5,11,13,11.4)
row <- factor(rep(1:2,2))
col <- factor(rep(1:2,each=2))
car <- c("B","A","A","B")
mat <- data.frame(row,col,car,data)
mat
# row col car data
# 1 1 1 B 12.5
# 2 2 1 A 11.0
# 3 1 2 A 13.0
# 4 2 2 B 11.4
我可能建议对此使用混合模型方法。
mat <- data.frame(data=c(12.5,11,13,11.4),
row=factor(rep(1:2,2)),
col=factor(rep(1:2,each=2)),
car=c("B","A","A","B"))
我使用lmerTest
是因为它可以更容易地为您提供(近似)p值
默认情况下,anova()
使用Satterthwaite近似,或者您可以告诉它使用更准确的Kenward Roger近似。在任何一种情况下,您都可以看到分母df正好或接近零,p值要么缺失,要么非常接近1,这表明您的模型没有意义(即,即使使用混合模型,它也被过度参数化)。
library("lmerTest")
anova(m1 <- lmer(data~car+(1|row)+(1|col),data=mat))
anova(m1,ddf="Kenward-Roger")
## Sum Sq Mean Sq NumDF DenDF F.value Pr(>F)
## car 0.0025 0.0025 1 9.6578e-06 2.0019 0.9999
尝试更大的设计:
set.seed(101)
mat2 <- data.frame(data=rnorm(36),
row=gl(6,6),
col=gl(6,1,36),
car=sample(LETTERS[1:2],size=36,replace=TRUE))
m2A <- lm(data~car+row+col,data=mat2)
anova(m2A)
## (excerpt)
## Df Sum Sq Mean Sq F value Pr(>F)
## car 1 1.2571 1.25709 1.6515 0.211
m2B <- lmer(data~car+(1|row)+(1|col),data=mat2)
anova(m2B)
## Sum Sq Mean Sq NumDF DenDF F.value Pr(>F)
## car 1.178 1.178 1 17.098 1.56 0.2285
anova(m2B,ddf="Kenward-Roger")
## Sum Sq Mean Sq NumDF DenDF F.value Pr(>F)
## car 1.178 1.178 1 17.005 1.1029 0.3083
让我有点惊讶的是,lm
和lmerTest
的答案在这里相距如此之远——我本以为这是一个有一个精心制定的"经典"答案的例子——但我不确定。可能值得在CrossValidated或谷歌上跟进。
fit <- lm(data~row+col+car,mat)
coef(fit)
# (Intercept) row2 col2 carB
# 12.55 -1.55 0.45 -0.05
因此,row
因子的影响为-1.55,col
因子的影响是0.45,car
因子的作用是-0.05。截距项是当所有因子都处于第一级(row=1
、col=1
、car=A
)时预期的data
的值。
请注意,您的设计被过度指定了:您只有4条数据,这足以指定两个因素的影响及其交互作用,但您已经将其设置为car
是交互作用。因此,没有留下错误的自由度。