RandomForestSRC error and vimp



我正在尝试根据R中的RANDOMFORESTRC小插图进行随机森林生存分析。我有一个包含 59 个变量的数据框 - 其中 14 个是数字变量,其余是因子。其中 2 个数字是时间(死亡前几天(和死亡(0/1 死亡与否(。我遇到了 2 个问题:

trainrfsrc<- rfsrc(Surv(TIME, DIED) ~ .,
data = train, nsplit = 10, na.action = "na.impute") 

TRAINRFSRC给出: 错误率: 17.07%

工作正常,但是探索错误率,例如:

plot(gg_error(trainrfsrc))+ coord_cartesian(y = c(.09,.31)) 

返回:

geom_path: Each group consists of only one observation. Do you need to adjust the group aesthetic?

或:

a<-(gg_error(trainrfsrc))
a 
error ntree 1 NA 1 2 NA 2 3 NA 3 4 NA 4 5 NA 5 6 NA 6 7 NA 7 8 NA 8 9 NA 9 10 NA 10 

所有 1000 棵树的 NA。为什么每尝试一棵树没有错误率?

第二个问题是尝试使用 VIMP 探索最重要的变量时,例如:

plot(gg_vimp(trainrfsrc)) + theme(legend.position = c(.8,.2))+ labs(fill = "VIMP > 0")

它返回:

In gg_vimp.rfsrc(trainrfsrc) : rfsrc object does not contain VIMP information. Calculating...

有什么想法吗?谢谢

设置 err.block=1(或 1 和 ntree 之间的某个整数(应该可以解决返回 NA 的错误问题。您可以在 rfsrc 下查看帮助文件以了解有关 err.block 的更多信息。

最新更新