当我使用类型为"interval2"的生存对象时,我注意到survfit
之间略有不同。 我首先注意到 interval2 拟合上存在风险的数字不是整数。我已经走了survfit.formula
和surviftKM
,但我仍然不清楚到底发生了什么以及为什么。谁能向我解释一下其中的区别? 调试时,它似乎survfitKM
正在使用一些 .05 权重(casewt
变量),但我没有明确设置。
地雷危险系数:
library('survival')
surv_obj <- with(lung, Surv(time = time, event = status == 1))
left <- lung$time
right <- ifelse(lung$status == 1, lung$time, NA)
surv_obj_int <- Surv(time = left, time2 = right, type = 'interval2')
surv_fit <- survfit(surv_obj~1, type = 'kaplan-meier')
surv_fit_int <- survfit(surv_obj_int~1, type = 'kaplan-meier')
存储库所有者很好心地解释。
当存在区间删失数据时,代码使用特恩布尔估计(survfitTurnbull)。在这种情况下,风险数字没有很好地定义,代码使用"工作"值。在您的特定示例中,没有间隔审查观察,如果更聪明,代码会注意到并使用survfitKM:更准确,更快。但是用户不倾向于使用 interval2 样式,除非他们需要它。
虽然,我将肺视为间隔审查,但没有实际的间隔。如果有一个正确的值,它总是等于左值。