随机森林使用"在训练时大量决策树,并输出作为单个树的类(分类)模式的类"。
有没有办法,而不是使用作为模式的类,在原始树产生的输出上运行另一个随机森林?
奖励问题:这是个坏主意有什么原因吗?(我相信人们以前会想到这一点)
您可以在拟合的随机林实例的 estimators_
属性中访问各个决策树。
您甚至可以对该属性(它只是决策树对象的 Python 列表)重新采样以添加或删除树,并查看对结果林的预测质量的影响。
我认为
只是一个性能选项,你的想法听起来不错,但没有更好的"随机性",但计算速度可能更慢。