尽管设置了种子,但我无法重现随机森林的rfsrc结果。每次运行下面的代码时,我都会看到按重要性顺序列出的变量有不同的顺序。以下是我尝试过的:
set.seed(415)
fit1sjl <- rfsrc(Social_Jetlag_Comp ~ ., data=df, importance="permute",
ntree=2000)
我也试过
fit1sjl <- rfsrc(Social_Jetlag_Comp ~ ., data=df, importance="permute",
ntree=2000, seed=415)
我做错了什么?如果这有助于解释的总体方差(OOB估计(非常低。
在randomForestSRC 的文档中
上面写着:
关于再现性,模型由种子定义林中树的拓扑结构,以及训练数据。这允许用户恢复模型,并且在特别是其终端节点统计。另一方面,VIMP和许多其他统计数据依赖于额外的随机化我们不考虑模型的一部分。这些统计数据易受影响蒙特卡罗效应。
因此,变量重要性(VIMP(没有在包中实现,以实现可复制性。