我需要用线性混合效应模型评估两次就诊之间脂肪的纵向变化。
我有一些从第1次就诊到第2次就诊会发生变化,因为它们是高血压状态、糖尿病状态、bmi、腰围、吸烟状态等。还有其他变量从第1次访视到第2次访视不会发生变化,比如它们是性别或种族
以下变量是虚拟的(高血压状态、糖尿病状态、吸烟状态、性别(,而以下变量是连续的(体重指数、腰围、年龄。
我使用nlme
包的最初想法表示为:
lme(fat~ diabetes_status + hypertension_status + bmi + waist + smoker + gender + ethnicity + Visit, random= ~1|PatientID/Visit, data = df, na.action = na.omit)
访问有两个级别(1和2(
问题:
- 你认为这是评估脂肪是否存在纵向变化的正确方法吗
- 你认为这包含了太多的固定效果吗
PS:我为您提供了一个示例数据集:
df <- data.frame(PatientID = c(1000344, 1000344,1001471, 1001471, 1002830, 1002830),Visit = c(1,2,1,2,1,2),fat= c( 8.510 ,14.456, 4.612,4.738,18.021,25.740), diabetes_status= c("False" ,"True","False" ,"False" ,"False","True"), hypertension_status= c("True" ,"True","False" ,"True" ,"False","True"),bmi= c(32.0386 ,33.4919 ,29.6878 ,28.7660 ,26.1540 ,26.2788), waist= c(105 ,105 ,98 ,101 ,91 ,96), smoker= c(1 ,0 ,0 ,0 ,1 ,0), gender= c(1 ,1 ,0 ,0,1 ,1), ethnicity= c(1,1 ,0,0,1 ,1), stringsAsFactors = F)
谢谢!
您所拥有的并不是一个糟糕的开始。固定效果参数(您可以通过在模型对象上运行fixef()
来获得(应该可以为您提供每个模型对结果变量的固定效果的"总体"效果的一些指示。
在不知道你有多少数据的情况下,很难说你的模型是否包含了太多固定效果。其他一些因素也可能很重要,比如你的预测因素的共同变化程度(尤其是伪变量(。对于你的样本数据集,你肯定有太多的固定影响,然而,我猜你在真实数据集中有六个以上的观察结果。这里的一些低挂水果可能可以去除BMI或腰围。两者本质上都试图衡量同一件事。
我建议花一些时间与J.C.的Pinheiro和d.M.的Bates(2000(一起";S和S-PLUS中的混合效应模型";,施普林格。这是一个很好的资源,有很多不同的例子。混合效应模型是一个大课题。我相信这本书也有一些章节介绍了建立模型复杂性的顺序,以及如何测试添加或固定和随机效果是否会改善模型。例如,在评估固定/随机效应的包含/去除时,是否使用最大似然或限制最大似然来拟合模型很重要。
编辑:我刚刚注意到你只有两次来访。您可能最好剥离访问模型层并对";脂肪的变化";在访问之间作为结果。如果在这两次就诊中,每个患者只有一次测量,那么您也不需要患者ID级别。因此,您可以使用一个简单的线性回归模型。然而,我根据您提供的样本数据对您的数据进行了一些假设。