我的训练数据集只包含2个类和40个特征。
在情况1中,类1有35个样本,类2有700个样本。
在情形2中,类1有65个样本,类2的值与上述相同。
我的训练数据集是否足以使用SVM分类器或其他分类器构建模型?
我正在使用WEKA。测试选项是10倍交叉验证和%66,我得到了非常好的结果。
您对结果感到满意,因此这意味着您有足够的数据。很难说你需要多少数据,这取决于你正在解决的问题,你的数据中有多少噪音,有什么特征等。
我在第二部分描述了它:https://stackoverflow.com/a/31567143/1030820