在深度学习模型的训练中,我用来输入的数据集中元素的顺序是否重要?



更具体地说,我正在处理一个NLP问题,并训练LSTM在给定初始单词序列的情况下进行单词预测。我的数据集是200k reddit评论。

如果我一次随机输入一个示例(允许重复输入(或按顺序输入它们(不允许重复(是否重要?

由于您的数据实际上是一组注释,因此无需按顺序处理它们。事实上,通常最好以随机顺序处理数据,以确保网络不会学习与顺序相关的内容。重复根本不重要,只要您均匀采样即可。

相关内容

最新更新