找出随机森林模型中有多少开箱记录



我的oob_score为0.97,测试数据的准确性为0.97。有没有办法知道有多少样本被用来计算oob_score?

这可能会让一些人对结果更有信心。

rf.oob_score_ # for oob score
rf.score(X_test_scaled,y_test) # for accuracy on test data 

简短的答案是ca。36%的样本:https://www.researchgate.net/publication/228451484我不确定是否要计算确切的数字(尤其是oob样本的数量实际上只与它们所属的自举样本有关(,但另一篇文章进一步详细介绍了这36-37%的估计值的真实来源:https://stats.stackexchange.com/questions/173520/random-forests-out-of-bag-sample-size

最新更新