小贝子编程

使用sklearn load_files()从png中加载图像作为数据

我目前正在使用sklearn构建一个简单的图像识别器。

我需要使用load_files('./directory/')从该目录下的子文件夹加载图像。

它正确地获得了目标值，但数据属性不是简单的像素值。我假设我需要设置编码参数来考虑图像文件，但找不到确切的使用方法。

encoding参数用于解码文件内容的原始字节，假设采用文本编码(例如UTF-8)。

对于图像文件，您需要自己迭代filenames属性的内容，并使用类似scipy.misc.imread的内容(您还需要安装PIL或Pillow包)。

下面是一个实用程序函数，用于从野外的Labeled Faces中加载jpeg文件的数据为numpy数组:

https://github.com/scikit-learn/scikit-learn/blob/master/sklearn/datasets/lfw.py L108

您可以使用它来了解如何编写自己的自定义数据集加载器

相关内容