我正在训练一个语音到文本模型。在第一个历元上,WER为0.33,对于第二个历元,WER仍然相同,但是训练损失增加,而验证损失减少。
除了降低学习率,还有什么可以让模型学习,至少是过度拟合?
增加训练数据量,这是唯一的主要因素。与适当的架构和庞大的数据库相比,所有这些学习率和超参数都很小。
我正在训练一个语音到文本模型。在第一个历元上,WER为0.33,对于第二个历元,WER仍然相同,但是训练损失增加,而验证损失减少。
除了降低学习率,还有什么可以让模型学习,至少是过度拟合?
增加训练数据量,这是唯一的主要因素。与适当的架构和庞大的数据库相比,所有这些学习率和超参数都很小。
javascript python java c# php android html jquery c++ css ios sql mysql arrays asp.net json python-3.x ruby-on-rails .net sql-server django objective-c excel regex ruby linux ajax iphone xml vba spring asp.net-mvc database wordpress string postgresql wpf windows xcode bash git oracle list vb.net multithreading eclipse algorithm macos powershell visual-studio image forms numpy scala function api selenium