R中的随机森林(rfsrc)尽管结籽,但不可再生



尽管设置了种子,但我无法重现随机森林的rfsrc结果。每次运行下面的代码时,我都会看到按重要性顺序列出的变量有不同的顺序。以下是我尝试过的:

set.seed(415)
fit1sjl <- rfsrc(Social_Jetlag_Comp ~ ., data=df, importance="permute", 
ntree=2000)

我也试过

fit1sjl <- rfsrc(Social_Jetlag_Comp ~ ., data=df, importance="permute", 
ntree=2000, seed=415)

我做错了什么?如果这有助于解释的总体方差(OOB估计(非常低。

在randomForestSRC 的文档中

上面写着:

关于再现性,模型由种子定义林中树的拓扑结构,以及训练数据。这允许用户恢复模型,并且在特别是其终端节点统计。另一方面,VIMP和许多其他统计数据依赖于额外的随机化我们不考虑模型的一部分。这些统计数据易受影响蒙特卡罗效应。

因此,变量重要性(VIMP(没有在包中实现,以实现可复制性。

相关内容

  • 没有找到相关文章

最新更新