我正在尝试使用r中的时间相关协变量执行Cox比例风险分析。我已经阅读了相关文档(Therneau等人)和几个教程,但由于协变量在数据中的结构如何,我正在努力正确格式化我的数据。它是一个分段的时变协变量。
感兴趣的结果是"死亡",时间变量是"死亡",时间相关协变量包含在"死亡"中。又名阿司匹林柱。例如,第一例患者在基线、30天和1年未服用阿司匹林,但在最后一次随访时服用阿司匹林,在本例中为2275天。句号表示丢失的数据。
| ID | aspb | asp30 | asp1y | aspfu | death | fu |
|-------|------|-------|-------|-------|-------|-----------|
| 1479 | 0 | 0 | 0 | 1 | 0 | 2275 |
| 10523 | 1 | 1 | . | . | 1 | 41 |
| 25436 | 0 | 0 | 1 | 1 | 0 | 1773 |
我不知道如何实现表的(start, stop)格式,因为有1000多个案例。情况之间的时间间隔不一定一致,也就是说,"aspf"对应的时间也不一定一致,这也使情况变得复杂。可以是0天,30天,1年,…之间的任何时间
我确实在SPSS中完成了这个分析,使用了以下时间相关协变量的符号:(T_ <1)*aspb + (T_>=1 &T_ & lt识别;31)*asp30 + (T_>= 31 &T_ & lt识别;366)*asp1y + (T_>= 366)*asp1y。但我很难把它翻译成r。
任何指导将不胜感激!非常感谢!
试试这个:
## start time
df <- df %>%
group_by(ID) %>%
mutate(start_time = 0:(n() - 1))
df <- ungroup(df)
## end time
df <- df %>%
group_by(ID) %>%
mutate(end_time = 1:(n()))
df <- ungroup(df)
```