在最近的ImageAI更新之后,在自定义对象检测训练期间几乎没有GPU使用



大约一个月前,我在谷歌Colab Pro上使用TensorFlowGPU 1.13,使用ImageAI训练了一个使用750张图像的自定义对象检测模型,训练时间大约为30min/epoch。现在,当我使用相同的数据集但使用TensorFlowGPU 2.4.3(ImageAI不再支持旧的TF(进行训练时,我得到的GPU使用量很少(0.1GB(,每个历元训练时间为6小时。我试过在我的本地机器上训练同样的型号,但我的训练时间也很慢。

我正在使用以下导入(基于ImageAI文档(:

!pip install tensorflow-gpu==2.4.0 keras==2.4.3 numpy==1.19.3 pillow==7.0.0 scipy==1.4.1 h5py==2.10.0 matplotlib==3.3.2 opencv-python keras-resnet==0.2.0!pip install imageai --upgrade

我正在从谷歌硬盘中提取我的训练数据。

我有没有遗漏什么可以加快我在谷歌Colab或本地机器上的物体检测训练时间?缓慢的训练时间使我的研究速度减慢。

根据我的经验,如果你想完全使用GPU,你必须恢复到以前版本的ImageAI及其兼容包。以下是截至目前(2021年1月(我在本地机器和谷歌Colab:上安装的兼容软件包列表

  • TF-GPU==1.13.1
  • Keras==2.2.4
  • Imageai==2.1.0

这修复了由ImageAI的最新补丁引起的任何问题。我现在回到GPU的完全使用。在问题得到修复之前,我建议使用旧版本。

最新更新