mxnet将数据/模型存储在R之外的地方吗?我一直遇到这样的场景:当天的第一次 NN 运行将产生良好的结果,并且接下来的每次运行(即使是完全相同的代码(都会为所有训练步骤生成 NA/NaN。
示例:https://github.com/xup6fup/MxNetR-examples/blob/master/1.%20Basic%20models/3.%20softmax%20regression/1.%20Standard%20example.R
我按原样复制并粘贴了代码,运行它并获得了大约 70% 的准确率。我注意到该设备已设置为CPU,并且我已编译了GPU版本。所以我把它改成gpu,重新运行.....所有 NaN。清除 R 会话工作区,使用 CPU 重新运行原始代码,全部 NA。
重新启动 Rstudio 服务器,重新运行确切的代码。全部不适用。似乎有些东西被存储在 rstudio 服务器之外,它会干扰后续的 FeedForward。我在多个 mxnet 教程中遇到了这个问题,它们通常第一次工作,但随后会失败,即使运行相同的代码也是如此。
如果库是在 2017 年 11 月 12 日之前的某个地方编译的,那么随机初始化中存在错误已有一段时间了,导致初始化权重都接近 0。