我在生存分析中遇到了障碍;我认为这与审查类型有关。这是我的前30行生存数据。tstart是指患者入院并开始接受干预,tstop是死亡(状态=1(或出院(审查,状态=0(:
tstart tstop status Intervention
1 2 14 0 FALSE
2 2 5 0 FALSE
3 2 10 1 FALSE
4 5 8 0 FALSE
5 6 10 0 FALSE
6 6 10 0 FALSE
7 7 10 0 FALSE
8 8 20 1 TRUE
9 8 25 0 FALSE
10 8 18 0 FALSE
11 8 11 0 FALSE
12 8 9 0 FALSE
13 9 11 0 FALSE
14 9 52 0 TRUE
15 9 26 1 FALSE
16 10 20 1 TRUE
17 10 14 0 FALSE
18 10 14 0 FALSE
19 10 11 0 FALSE
20 10 23 0 TRUE
21 10 26 0 TRUE
22 10 16 0 FALSE
23 11 21 0 TRUE
24 11 96 0 TRUE
25 11 14 0 FALSE
26 11 16 0 TRUE
27 11 14 0 FALSE
28 11 16 0 FALSE
29 11 16 0 FALSE
30 11 38 1 TRUE
根据我如何将这些数据输入到coxph函数中,我会得到两个不同的结果。即:
# METHOD ONE:
> coxph (Surv (time = (tstop - tstart), event = status) ~ Intervention, data = df.use)
Call:
coxph(formula = Surv(time = (tstop - tstart), event = status) ~
Intervention, data = df.use)
coef exp(coef) se(coef) z p
InterventionTRUE -0.05975 0.94200 0.04727 -1.264 0.206
Likelihood ratio test=1.58 on 1 df, p=0.2084
n= 7362, number of events= 2364
# METHOD TWO:
> coxph (Surv (time = tstart, time2 = tstop, event = status) ~ Intervention, data = df.use)
Call:
coxph(formula = Surv(time = tstart, time2 = tstop, event = status) ~
Intervention, data = df.use)
coef exp(coef) se(coef) z p
InterventionTRUE -0.29936 0.74129 0.04902 -6.106 0.00000000102
Likelihood ratio test=35.67 on 1 df, p=0.000000002337
n= 7362, number of events= 2364
我原以为这两种方法会返回相同的风险比,但结果截然不同。为什么会这样?如何避免?
我不认为Surv(time = (tstop - tstart), event = status)
等同于Surv (time = tstart, time2 = tstop, event = status)
。time
和time2
之间的间隔并不是整个观察结果,而是已知死亡或审查发生的时间。因此,所有死亡事件的time
和time2
都等于tstop - tstart
。
当你不知道死亡或审查的确切时间,但你知道它在两个值之间时,就会使用间隔。