如何在Docker中使用GPU来重新训练对象检测模型



我一直在学习谷歌珊瑚关于在docker中重新训练对象检测模型的教程,它明确表示这只用于CPU训练,这非常慢。

有没有一种简单的方法可以移植这个docker容器来利用GPU(nvidia GTX 1080(。我已经安装了nvidia-docker2,并成功地将我的gpu传递到其他容器中,据我所知,还有这个容器,使用--gpus all标签。nvidia-smi命令在我的容器中工作,所以我几乎可以肯定我的GPU已经成功通过,但在训练模型时没有使用它。

根据nvidia-smi,CUDA版本是11.4,无论是在容器内部还是外部,我使用的是Ubuntu 20.04。

回答我自己以结束问题,因为我看不到在评论上做这件事的方法,解决方案是sebastian sz:的评论

"tensorflow/tensorflow:1.15.5是仅限cpu的映像,您应该使用tensorflow/tensorflow:1.15.5-gpu来使用CUDA。–sebastian sz1月21日14:36";

谢谢你的帮助。

您可以尝试Docker提供的解决方案https://github.com/google-coral/tutorials/issues/5#issuecomment-821860067或使用谷歌珊瑚教程中基于GPU的colab教程(https://github.com/google-coral/tutorials)重新训练目标检测模型

相关内容

  • 没有找到相关文章

最新更新