为什么我们需要test_generator和val_generator来进行数据扩充



数据扩充仅用于训练。我想知道为什么几个教程会创建test_generator和val_generator。为什么我们不只创建train_generator呢。

实际上,将训练数据和验证数据分离是一种非常好的做法。如果你只创建了一个生成器,那么你很有可能用相同的增强数据来验证你的模型,这会给你的准确性带来偏差。此外,通常情况下,当我们有少量的训练数据时,我们会使用数据扩充,这会使情况变得更糟,并最终导致高偏差模型。因此,我们应该将数据分开,并确保您的模型没有暴露在任何类型的验证数据中,这样它就不会给您的性能增加任何偏差。

例如,您可能最终使用顺时针旋转的图片1来训练模型,并使用逆时针旋转的照片1来验证模型。因此,我们通常用于确定过拟合的验证准确性是有偏差的,您可能会在不知道训练期间何时发生过拟合的情况下得出过拟合模型。

最新更新