r-嵌套的随机效应和相关的固定效应



我有跨国家的小组数据,我想知道IV对二元学生水平结果DV的影响

我想包括一个嵌套的随机效应,它考虑到学生所在的学校会影响结果,并且不同国家的学校有着显著的差异:(1|country/school)。所以我开始使用的模型是:

model = glmer(DV ~ IV + (1|country/school), data=data, family = 'binomial')

我还想考虑一下时间趋势。起初,我认为我应该采用固定年份效应,但随着时间的推移,这些国家的政治发展差异很大,我想知道,虽然1991年可能会让A国的学校陷入动荡,但1991年可能是B国教育资金的好年份

model = glmer(DV ~ IV + (1|country/school) + as.factor(country_year),
data=data, family = 'binomial')

模型的随机效应为:

Random effects:
Groups          Name        Variance  Std.Dev. 
school:country (Intercept) 5.703e-02 2.388e-01
country         (Intercept) 4.118e-15 6.417e-08
Number of obs: 627, groups:  school:country, 51; country, 22

当模型中已经包含国家随机效应时,包含国家年份固定效应是否不正确?

另一种提问方式:我应该如何处理schoolcountry的子集,country_yearcountry的子集,但schoolcountry_year都不是彼此的子集的事实?

据我所见,你们有22个国家。目前尚不清楚country_year是什么,但假设它只是country:year的一个假人,那么将其作为一个固定效应(作为一个因素)可能不是一个好主意,因为会有太多的水平无法有效解释。

由于您对时间趋势感兴趣,因此将year作为固定效应包括在内是有意义的:

DV ~ IV + (1|country/school) + as.factor(year)

如果有很多years,你可能会发现它最好包括年份作为数字

DV ~ IV + (1|country/school) + as.numeric(year)

因为这将估计一年的单一(线性)趋势,而如果它是一个因素,那么无论有多少年(减1),它都会计算一个估计,当有很多水平时,这将不容易解释。然而,当编码为一个因子时,估计值可以指示是否存在非线性趋势,然后您可以切换到as.numeric并引入非线性项。

OP的最后一段有点令人困惑。如果country_year真的嵌套在country中,那么我们将有:

DV ~ IV + (1|country/school) + (1|country:country_year)

与相同

DV ~ IV + (1|country) + (1/school:country) + (1|school:country_year)

然而,这将不会估计任何时间趋势。如果你想估计一个趋势,那么你需要将year(或country_year)包括为如上所述的固定效应,并且你可以通过将其包括为随机斜率来允许不同学校(和/或国家)之间的差异,例如:

DV ~ IV + year + (1|country) + (year|school:country)

相关内容

  • 没有找到相关文章

最新更新