更具体地说,我正在处理一个NLP问题,并训练LSTM在给定初始单词序列的情况下进行单词预测。我的数据集是200k reddit评论。
如果我一次随机输入一个示例(允许重复输入(或按顺序输入它们(不允许重复(是否重要?
由于您的数据实际上是一组注释,因此无需按顺序处理它们。事实上,通常最好以随机顺序处理数据,以确保网络不会学习与顺序相关的内容。重复根本不重要,只要您均匀采样即可。
更具体地说,我正在处理一个NLP问题,并训练LSTM在给定初始单词序列的情况下进行单词预测。我的数据集是200k reddit评论。
如果我一次随机输入一个示例(允许重复输入(或按顺序输入它们(不允许重复(是否重要?
由于您的数据实际上是一组注释,因此无需按顺序处理它们。事实上,通常最好以随机顺序处理数据,以确保网络不会学习与顺序相关的内容。重复根本不重要,只要您均匀采样即可。
javascript python java c# php android html jquery c++ css ios sql mysql arrays asp.net json python-3.x ruby-on-rails .net sql-server django objective-c excel regex ruby linux ajax iphone xml vba spring asp.net-mvc database wordpress string postgresql wpf windows xcode bash git oracle list vb.net multithreading eclipse algorithm macos powershell visual-studio image forms numpy scala function api selenium