增加数据集大小的分类机器学习


湿度>NPK>土壤作物肥料<295.61>><2.5>0>>>3<192.90><5.55><2.0>>50174.806.182.03.92.1306
指数 温度降雨量>pH
0 24.87 82.846.594.02.01
1 28.6996.65178.966.084.04.0
2 20.27 81.64 270.44 5.01 4.02.061
3 25.07 95.022.13.55
4 25.04 95.90

由于这听起来像是一个分类问题,因此尝试平衡数据集以使所有类都具有相同数量的样本是非常有用的。你可以简单地通过过采样来做到这一点,这意味着你用更少的样本来重复类,以观察不平衡。

该文档还向您展示了如何使用更复杂的过采样方法,如ADASYN和SMOTE。我建议两者都试试。

最新更新