"Labelled Faces in the Wild"数据集(scikit learn)中"数据"字段的性质是什么?



我正在尝试使用从sklearn.datasets.fetch_lfw_people获取的数据来训练一个简单的HOG人脸检测器。 获取数据集后,我找到以下键:

In [1]:  lfw_people.keys()
Out[1]:  ['images', 'data', 'target_names', 'DESCR', 'target']
  • images包含裁剪的人脸
  • target_names包含人类可读的名称
  • target包含图像中人物的数字 ID 号
  • DESCR将记录标识为属于 LFW 数据集。

。但data到底是什么?

在我的例子中,它是一个(13233 x 1850)的浮点数数组,也就是说每张图像一行 1850 个浮点数。

这个data领域的性质是什么?

(lfw_people.images[0].ravel() == lfw_people.data[0]).all()的计算结果为True,因此看起来data场只是展平为向量的图像。

谜团解决了,但这种事情真的应该提前指出:/

最新更新