在 R 中使用随机森林预测的不同结果

当我对测试数据运行随机森林模型时，我得到的相同数据集+模型的结果不同。

以下是您可以看到第一列差异的结果：

> table((predict(rfModelsL[[1]],newdata = a)) ,a$earlyR)
        FALSE TRUE
 FALSE    14    7
 TRUE     13   66
> table((predict(rfModelsL[[1]],newdata = a)) ,a$earlyR)
        FALSE TRUE
 FALSE    15    7
 TRUE     12   66

虽然差异很小，但我试图了解是什么原因造成的。我猜predict有"灵活"的分类阈值，尽管我在文档中找不到;我说的对吗？

提前谢谢你

我假设您没有在这里重新修改模型，但只是产生这些结果的predict调用。答案可能是这样的，来自?predict.randomForest：

任何联系都是随机断开的，所以如果这是不可取的，请通过以下方式避免它在 randomForest（）中使用奇数 ntree

相关内容

最新更新

热门标签：