我正在尝试使用从sklearn.datasets.fetch_lfw_people
获取的数据来训练一个简单的HOG人脸检测器。 获取数据集后,我找到以下键:
In [1]: lfw_people.keys()
Out[1]: ['images', 'data', 'target_names', 'DESCR', 'target']
-
images
包含裁剪的人脸 -
target_names
包含人类可读的名称 -
target
包含图像中人物的数字 ID 号 -
DESCR
将记录标识为属于 LFW 数据集。
。但data
到底是什么?
在我的例子中,它是一个(13233 x 1850)
的浮点数数组,也就是说每张图像一行 1850 个浮点数。
这个data
领域的性质是什么?
(lfw_people.images[0].ravel() == lfw_people.data[0]).all()
的计算结果为True
,因此看起来data
场只是展平为向量的图像。
谜团解决了,但这种事情真的应该提前指出:/