Weka中不同的采样方法



我有一个不平衡的数据集。我尝试用不同的重采样方法来平衡它。到目前为止,我知道有三种方法来处理采样。1. 2.随机抽样交叉验证3。引导。

我使用Weka进行数据预处理。我知道如何在Weka中使用交叉验证。它带有随机森林或朴素贝叶斯或任何其他分类器。

但是我没有找到随机抽样或Bootstrap。

我发现有监督的->实例→重新抽样和无监督->实例→重新取样。

我想知道两个样本的区别。这篇文章不是很有帮助。我如何在Weka中使用bootstrap ?有其他选择吗?

Bootstrapping在Weka中并不是一个真正的评估方法。

见Eibe几年前对Wekalist邮件的回复:

https://list.waikato.ac.nz/hyperkitty/list/wekalist@list.waikato.ac.nz线程/WIHQM6EK5HM4J4FHOOFNKDINK2EEWYZI/