带有验证数据和验证标签的 Keras 多类分类器错误:输入数组应具有与目标数组相同的样本数

我正在尝试使用 Keras 为 24 个类构建一个多类分类器，使用 VGG16 瓶颈特征和顶部的小型全连接模型。

起初我试图遵循本教程：https://blog.keras.io/building-powerful-image-classification-models-using-very-little-data.html 将其调整为多类，然后我收到错误并尝试使用其他教程的代码：http://www.codesofinterest.com/2017/08/bottleneck-features-multi-class-classification-keras.html 并得到完全相同的错误。我无法弄清楚问题出在哪里！

我得到的错误是：">值错误：输入数组应该具有与目标数组相同数量的样本。找到 12768 个输入样本和 12782 个目标样本。">

基本上我有两个文件夹，训练和验证。火车文件夹有 52992 个 png 图像，验证文件夹有 12782 个 png 图像。我的批量大小是 16。

以下是我保存验证数据的save_bottleneck_features()代码(此函数在train_top_model()函数之前调用)：

generator = datagen.flow_from_directory(
validation_data_dir,
target_size=(img_width, img_height),
batch_size=batch_size,
class_mode='categorical',
shuffle=False)
nb_validation_samples = len(generator.filenames)
predict_size_validation = int(
math.ceil(nb_validation_samples / batch_size))

bottleneck_features_validation = model.predict_generator(
generator, predict_size_validation)
np.save('bottleneck_features_validation.npy',
bottleneck_features_validation)

这是我计算验证标签的train_top_model()中的代码：

generator_top = datagen_top.flow_from_directory(
validation_data_dir,
target_size=(img_width, img_height),
batch_size=batch_size,
class_mode= 'categorical',
shuffle=False)
nb_validation_samples = len(generator_top.filenames)
validation_data = np.load('bottleneck_features_validation.npy')
validation_labels = generator_top.classes
validation_labels = np.array(
[0] * (nb_validation_samples / 2) + [1] * (nb_validation_samples / 2))
validation_labels = to_categorical(
validation_labels, num_classes=num_classes)

print predict_size_validation打印 798
print nb_validation_samples打印 12782
print len(validation_data)打印 12768
print len(validation_labels)打印 12782

列车数据和列车标签的计算方式相同，但它们是可以的。

我认为问题可能出在predict_size_validation上，而 12782 不能被 16 整除。

谢谢！！！

在python 2中，我假设您正在使用给定注释，默认情况下，两个整数的除法给出了整数除法。这意味着12782 / 16 == 798(在python 3中，这相当于12782 // 16)而不是像python 3那样12782 / 16 == 798.875。

为了解决此问题，您应该确保除法中的一个数字是浮点数，以便获得正确的行为，例如

import math
predict_size_validation = int(math.ceil(nb_validation_samples / float(batch_size)))

或者，您可以使用__future__模块来获取 python 3 行为，即

import math
from __future__ import division
predict_size_validation = int(math.ceil(nb_validation_samples / batch_size))

另一种解决方案是依靠整数除法来进行计算(而不是依赖math.ceil)：

predict_size_validation = nb_validation_samples // batch_size
if nb_validation_samples % batch_size != 0:
predict_size_validation += 1

有关 python 2 浮点除法的更多信息，请参阅此答案

相关内容

最新更新

热门标签：