我有一个不平衡的数据集。我尝试用不同的重采样方法来平衡它。到目前为止,我知道有三种方法来处理采样。1. 2.随机抽样交叉验证3。引导。
我使用Weka进行数据预处理。我知道如何在Weka中使用交叉验证。它带有随机森林或朴素贝叶斯或任何其他分类器。
但是我没有找到随机抽样或Bootstrap。
我发现有监督的->实例→重新抽样和无监督->实例→重新取样。
我想知道两个样本的区别。这篇文章不是很有帮助。我如何在Weka中使用bootstrap ?有其他选择吗?
Bootstrapping在Weka中并不是一个真正的评估方法。
见Eibe几年前对Wekalist邮件的回复:
https://list.waikato.ac.nz/hyperkitty/list/wekalist@list.waikato.ac.nz线程/WIHQM6EK5HM4J4FHOOFNKDINK2EEWYZI/