当我对测试数据运行随机森林模型时,我得到的相同数据集+模型的结果不同。
以下是您可以看到第一列差异的结果:
> table((predict(rfModelsL[[1]],newdata = a)) ,a$earlyR)
FALSE TRUE
FALSE 14 7
TRUE 13 66
> table((predict(rfModelsL[[1]],newdata = a)) ,a$earlyR)
FALSE TRUE
FALSE 15 7
TRUE 12 66
虽然差异很小,但我试图了解是什么原因造成的。我猜predict
有"灵活"的分类阈值,尽管我在文档中找不到;我说的对吗?
提前谢谢你
我假设您没有在这里重新修改模型,但只是产生这些结果的predict
调用。答案可能是这样的,来自?predict.randomForest
:
任何联系都是随机断开的,所以如果这是不可取的,请通过以下方式避免它 在 randomForest() 中使用奇数 ntree