正如您所知,tensorflow/keras的最新版本允许将数据扩充层集成到模型中。API的这一功能是一个很好的选择,尤其是当您希望对具有多模式输入和不同输入的不同子网络的模型的一部分输入(图像(应用图像增强时。与没有增强相比,这种增强的测试准确率提高到3-5%。
但我不知道在这种增强方法的实际训练中使用了多少训练样本。为了简单起见,假设我在拟合模型时传递了一个numpy数组列表作为模型的输入。例如,如果我有1000个带有增强层的模型的训练案例,那么在训练中会使用1000个带有变换图像的训练案例吗?如果没有,有多少?
我试着在所有相关的网站(教程和文档(上搜索这个简单问题的答案,但没有成功。
我想我找到了答案。基于模型的训练日志,增强层不产生额外的图像,而是对原始图像进行随机变换。为了增加生成的数据量,用户必须提供原始训练数据的多个副本作为模型的输入。