在重量更新中使用随机梯度下降时,许多CNN论文使用动量= 0.9。使用它有一个很好的逻辑,但是我正在寻找的是对该参数效果的彻底探索。我已经浏览了许多论文,这里和那里都有一些见解,但是我无法进行全面的探索。另外,它在不同的计算机视觉任务(例如分类,分割,检测)中是否有用?
这是有关此主题的好评论论文。。史密斯https://arxiv.org/pdf/1803.09820.pdf
在重量更新中使用随机梯度下降时,许多CNN论文使用动量= 0.9。使用它有一个很好的逻辑,但是我正在寻找的是对该参数效果的彻底探索。我已经浏览了许多论文,这里和那里都有一些见解,但是我无法进行全面的探索。另外,它在不同的计算机视觉任务(例如分类,分割,检测)中是否有用?
这是有关此主题的好评论论文。。史密斯https://arxiv.org/pdf/1803.09820.pdf
javascript python java c# php android html jquery c++ css ios sql mysql arrays asp.net json python-3.x ruby-on-rails .net sql-server django objective-c excel regex ruby linux ajax iphone xml vba spring asp.net-mvc database wordpress string postgresql wpf windows xcode bash git oracle list vb.net multithreading eclipse algorithm macos powershell visual-studio image forms numpy scala function api selenium