我一直在 GPU 上仅使用 tensorflow 在tf.device()
的帮助下训练模型,直到现在它工作正常。我正在 Keras 中制作另一个 NN 模型,并且在使用model.fit
时它给了我 OOM 错误。
谁能指导我如何解决这个问题?
当您的模型想要使用更多的内存而不是可用内存时,会出现OOM(内存不足(错误。在训练之前,请检查您的 GPU 内存是否被某个进程占用。在 nvidia GPU 中,您可以在开始训练之前通过 cmd 中的命令nvidia-smi
检查内存。
如果在开始训练之前任何进程或模型都没有占用内存,并且您仍然收到 OOM 错误,则必须通过更改批大小或减小数据大小或图像大小或通过减少模型的可训练参数(神经元数量(来优化模型。
现在已经解决了。我切换到google.colab一段时间,但一段时间后,我在我的设备上使用它并且运行良好,我确实清理了一些介于两者之间的文件,并正在试验我的GPU,我想触发了解决方案。无论如何,谢谢你。