我必须在155个图像特征向量之间进行比较。每个特征向量有5个特征。我的形象分为10类。不幸的是,我需要至少100张图像的类使用支持向量机,有其他选择吗?
每个类15个样本对于任何机器学习模型来说都是非常低的。与其浪费时间尝试许多模型类和参数,不如手工收集和标记新的示例。这样会更有成效。如果你有一堆未标记的图片,你可以使用https://www.mturk.com/等服务。
查看pybrain.http://pybrain.org。并且可能使用神经网络,因为我听说它们需要比svm更少的数据来训练,但更不准确。
如果属于同一类的图像是对某些起始图像进行转换的结果,则可以通过对标记示例进行转换来增加训练规模。
例如,如果你正在做字符识别,精细或弹性转换可以使用。P.Simard在《卷积神经网络应用于视觉文档分析的最佳实践》一书中对其进行了更详细的描述。在论文中,他使用了神经网络,但同样适用于SVM。