在 R 中使用随机森林预测的不同结果



当我对测试数据运行随机森林模型时,我得到的相同数据集+模型的结果不同。

以下是您可以看到第一列差异的结果:

> table((predict(rfModelsL[[1]],newdata = a)) ,a$earlyR)
        FALSE TRUE
 FALSE    14    7
 TRUE     13   66
> table((predict(rfModelsL[[1]],newdata = a)) ,a$earlyR)
        FALSE TRUE
 FALSE    15    7
 TRUE     12   66

虽然差异很小,但我试图了解是什么原因造成的。我猜predict有"灵活"的分类阈值,尽管我在文档中找不到;我说的对吗?

提前谢谢你

我假设您没有在这里重新修改模型,但只是产生这些结果的predict调用。答案可能是这样的,来自?predict.randomForest

任何联系都是随机断开的,所以如果这是不可取的,请通过以下方式避免它 在 randomForest() 中使用奇数 ntree

最新更新