如何为神经网络WITG小数据集选择超参数和策略



我目前正在进行语义细分,但是我的数据集很小,

我只有大约700张图像,例如,数据增加了,可以翻转

将其制作2100图像。

不确定这是否足以完成我的任务(四个

的语义细分

类)。

我想使用批处理归一化,而迷你批处理梯度下降

真正让我刮擦的是,如果批处理大小太小,

批发归一化的效果不佳,但是批量较大,

这似乎等同于全批量梯度下降

我想知道样品和批次之间是否有类似标准比率大小?

让我首先解决问题的第二部分"使用小数据集的神经网络策略"。您可能需要在较大的数据集上进行验证的网络,并使用较小的数据集对该网络进行微调。参见,例如,本教程。

第二,您询问批次的大小。实际上,较小的批次将使算法像经典随机梯度下降一样绕着最佳徘徊,其迹象是您损失的嘈杂波动。而批处理尺寸较大,通常具有更"平滑"的轨迹。无论如何,我建议您使用具有亚当等动量的算法。这将有助于您的培训的融合。

启发性,批处理大小可以保持与GPU内存合适的大小。如果GPU存储器的数量不够,则批量大小会减小。

最新更新