我一直在学习谷歌珊瑚关于在docker中重新训练对象检测模型的教程,它明确表示这只用于CPU训练,这非常慢。
有没有一种简单的方法可以移植这个docker容器来利用GPU(nvidia GTX 1080(。我已经安装了nvidia-docker2,并成功地将我的gpu传递到其他容器中,据我所知,还有这个容器,使用--gpus all
标签。nvidia-smi
命令在我的容器中工作,所以我几乎可以肯定我的GPU已经成功通过,但在训练模型时没有使用它。
根据nvidia-smi,CUDA版本是11.4,无论是在容器内部还是外部,我使用的是Ubuntu 20.04。
回答我自己以结束问题,因为我看不到在评论上做这件事的方法,解决方案是sebastian sz:的评论
"tensorflow/tensorflow:1.15.5是仅限cpu的映像,您应该使用tensorflow/tensorflow:1.15.5-gpu来使用CUDA。–sebastian sz1月21日14:36";
谢谢你的帮助。
您可以尝试Docker提供的解决方案https://github.com/google-coral/tutorials/issues/5#issuecomment-821860067或使用谷歌珊瑚教程中基于GPU的colab教程(https://github.com/google-coral/tutorials)重新训练目标检测模型