这个训练数据集是否足够训练和测试分类模型?



我的训练数据集只包含2个类和40个特征。

在情况1中,类1有35个样本,类2有700个样本。

在情形2中,类1有65个样本,类2的值与上述相同。

我的训练数据集是否足以使用SVM分类器或其他分类器构建模型?

我正在使用WEKA。测试选项是10倍交叉验证%66,我得到了非常好的结果。

您对结果感到满意,因此这意味着您有足够的数据。很难说你需要多少数据,这取决于你正在解决的问题,你的数据中有多少噪音,有什么特征等。

我在第二部分描述了它:https://stackoverflow.com/a/31567143/1030820

最新更新