我正在使用PROC GLIMMIX来分析有关特定性事件的重复测量数据。原始数据来自对约400人的每周日记研究。在每周,他们报告他们最近一次性接触的行为。我们也有关于他们人口统计数据的基线数据。收集了12周的观察结果,我们的完成率很高。
我想创建一个混合效应模型,但我不确定如何在 SAS 中做到这一点。我想测试特定事件因素以及某些人层面的人口统计数据的影响,并希望获得每个感兴趣因素的比值比。结果是在事件期间是否使用了药物,解释因素将是年龄,性别等以及事件的特征(即伴侣艾滋病毒状况),伴侣是否是常规性伴侣等。
我正在使用的代码遵循以下模式:
PROC GLIMMIX DATA=work.dataset oddsratio;
CLASS VISIT_NUMBER PARTICIPANT_ID BINARY_EVENTLEVEL_OUTCOME BINARY_EVENTLEVEL_EXPLANATORY_FACTOR CATEGORICAL_PERSONLEVEL_EXPLANATORY_FACTOR;
MODEL BINARY_EVENTLEVEL_OUTCOME = BINARY_EVENTLEVEL_EXPLANATORY CATEGORICAL_PERSONLEVEL_EXPLANATORY_FACTOR /DIST=binary link=logit CL S ddfm=kr;
RANDOM ?????;
RUN;
- ?????的选项 1:残余/主题=PARTICIPANT_ID
- ?????的选项 2:截取/主题=PARTICIPANT_ID
- ?????的选项 3:VISIT_NUM/主题=PARTICIPANT_ID残差类型=AR(1) 截距/主题=VISIT_NUM(PARTICIPANT_ID)
- ?????的选项 4:其他?
我也不清楚我是否应该在我的模型语句中使用ddfm=kr或在我的proc语句中使用method=laplace——两者都在其他地方被推荐用于这种重复的度量分析。
我遇到了几个潜在的建模选项,它们通常给出类似的结果,但选项 1 给出了事件级别的统计显著结果,而其他选项则给出了不显著的结果。包含 ddfm=kr 使感兴趣的结果更加重要。方法=拉普拉斯不允许选项 1。
我可能不会回答你的问题,但也许可以提供几个方向:
从最简单的部分开始,您的MODEL
陈述对我来说是正确的,因为您想测试事件级因素和人员级人口统计数据,因此它们被认为是固定效应。
现在,就随机效应而言:
您为选项 (1) 和 (2- ) 提出的
RANDOM
语句:(1)RANDOM _residual_ / subject=PARTICIPANT_ID;
或
(2)RANDOM intercept / subject=PARTICIPANT_ID;
分别对随机效应的两个不同部分进行建模:R 侧和G 侧。
如果您已经熟悉PROC MIXED
,您可能需要注意,在PROC GLIMMIX
中使用RANDOM _residual_
的选项(1)等同于在PROC MIXED
中使用REPEATED
语句,该语句告诉您对PARTICIPANT_ID
进行了重复测量,这显然是您的情况(参考:"比较GLIMMIX和MIXED Procedure") - 至于选项(3):
RANDOM VISIT_NUM / subject=PARTICIPANT_ID residual type=ar(1) INTERCEPT / subject=VISIT_NUM(PARTICIPANT_ID);
这里您将重复测量(visit_num
)的时间分量建模为随机效应,当您认为在每个测量时间(即在每个事件中)响应会随机变化时,应该包括这一点。乍一看,我认为这与您的情况无关,因为您已经通过固定效果考虑到了这一点......但当然,我没有看到您的数据可能是错误的。
到目前为止,这是我目前可以贡献的内容。
为了让您更好地理解,下一步,我建议您:
- 阅读
PROC GLIMMIX
文档概述,特别是数学模型规范和其中的所有 3 个部分:The Basic Model
G-Side and R-Side Random Effects and Covariance Structures
Relationship with Generalized Linear Models
- 如果您仍然不确定,请在 communities.sas.com 提出您的问题,这可能会更好地帮助您。
呵呵