随机森林-weka RandomForest是否使用bootstrap来获取训练集



我使用weka explorer,它有训练/测试拆分百分比项。它以给定的百分比将数据集分为训练集和测试集。我不知道它在weka RF的训练集中是否会有重复的实例。重复是否会影响结果。我所知道的RandomForest使用bootstrap和trainset具有重复的实例,并且与数据集具有相同的大小。

它是否会在weka RF 中的训练集中重复实例

是的,它制作了bootstrap样本,所以会有重复的实例,看看这里的答案:RandomForest在Weka 3.7 中的精确实现

以及重复是否会影响结果

这是随机森林的本质,也是它的运作方式。但请记住,它只是在重复的实例中学习,用于评估的测试集是不变的。

最新更新