我想使用randomForestSRC创建一个竞争风险模型(0个审查,1个感兴趣的事件,2个竞争事件(。我想预测每个人在不同时间感兴趣事件的概率。
概率是否与累积发生率函数 (CIF( 完全相同?
如果是这种情况,以下示例将给出概率
library(randomForestSRC)
data(wihs, package = "randomForestSRC")
wihs.obj <- rfsrc(Surv(time, status) ~ ., wihs, nsplit = 3, ntree = 100)
pred.obj = predict(wihs.obj)
probabilities = pred.obj$cif
并且给出的 CIF 的相应兴趣时间存储在
pred.obj$time.interest
我想知道这些CIF是否真的是事件的概率。
我们会参考文档,特别是关于竞争风险的部分:
https://kogalur.github.io/randomForestSRC/theory.html#section8.2
产生了两个相关的集合:特定原因累积风险函数的估计值(cs-CHF(和原因特异性累积发生率函数(cs-CIF(的估计值。 事件 j 的预测值是特定于原因的积分 cs-CIF。它可以解释为预期的生命年损失数,是死亡率的衡量标准。
文档中包含指向特定定义的链接和对现有理论的引用。