我有一堆训练图像(.jpg格式),我想作为Scikit Learn Learn的SVM分类器作为培训输入。知道这样做的首选方法是什么?
例如,在此处的示例中,图像数据从预定义的集合加载,并转换为SVM分类器在以下步骤中理解的格式。
# The digits dataset
digits = datasets.load_digits()
# To apply an classifier on this data, we need to flatten the image, to
# turn the data in a (samples, feature) matrix:
n_samples = len(digits.images)
data = digits.images.reshape((n_samples, -1))
我的问题是,我是否想加载我自己的一组图像,作为训练集合给SVM分类器,我该如何将这些图像转换为分类器将理解的格式。
我在OS-X(Mavericks)上开发,但我将在Linux(Ubuntu)上运行实际代码
谢谢
您可以使用decaf/noLearn/convnet进行此任务。请参阅此页面。
为什么不使用标准的Python库来使用图像,例如PIL或IT是叉枕。从中获得字节的numpy阵列应该很简单。
至于特征提取,我猜Thorsten具有更好的工具。