我想计算具有离散预测因子和不平衡数据的glm
模型中的边际均值。使用emmeans
包的函数emmeans
来获得边际均值,给出了设置weights="cell"
和weights="proportional"
的不同结果。软件包文件称,"proportional"
使用的权重与被平均的因子组合的频率(在原始数据中(成比例,"cells"
使用的权重根据被平均的单元的频率。但我不明白这到底意味着什么?!请看下面我r代码的简化版本!如有任何帮助,我将不胜感激。
model <- glm(formula=y~x1+x2, data=df, family=gaussian)
library(emmeans)
marginal_means_cells <- summary(emmeans(model, "x1", weights="cells"))
marginal_means_prop <- summary(emmeans(model, "x1", weights="prop"))
这将在;混乱数据";emmeans包中的vignette。假设在一个2因子设计中,你有这样的细胞频率:
Treatment
Dose | A B C | sum
------------------------------
a | 5 0 3 | 8
b | 11 3 9 | 23
------------------------------
sum | 16 3 12 | 31
然后使用";道具";权重,治疗的边际均值将全部用权重8和23计算,剂量的边际均值全部用权重16、3和12计算。
使用";细胞";权重,治疗的边际平均值是用A的权重5和11、B的权重0和3以及C的权重3和9计算的;剂量的边际平均值是用a的权重5、0、3和b的权重11、3、9来计算的。
如果模型包含Treatment:Dose
相互作用,则甚至不能估计具有0个观测值的细胞,因此使用";道具";权重,治疗B或剂量a的边际平均值也不能;细胞";重量。