tensorflow对象检测支持分布式策略吗



系统信息

  • 您正在使用的模型的顶级目录是什么:对象检测
  • 我是否编写了自定义代码(而不是使用TensorFlow中提供的股票示例脚本(:否
  • 操作系统平台和发行版(例如Linux Ubuntu 16.04(:Centos 7.5
  • TensorFlow安装自(源或二进制(:源
  • TensorFlow版本(使用下面的命令(:1.9.0
  • Bazel版本(如果从源代码编译(:0.19
  • CUDA/cuDNN版本:9.0
  • GPU型号和内存:Titan 1080 Ti/8G
  • 复制的确切命令:否
  • 分布式环境:2台机器,每台8个GPU

描述问题

我想进行一个关于物体检测的分布式训练。首先,我只需在命令中设置"TF_CONFIG"就可以运行文件"model_main.py",它运行得很顺利。这是进行分布式培训的正确方法吗?但这种方式似乎是一种异步训练。为了运行同步训练,我将"RunConfig"配置为blow,正如它在Distribution Strategy:中提到的那样

config = tf.estimator.RunConfig(train_distribute=tf.contrib.distribute.CollectiveAllReduceStrategy())

据报道:

属性错误:"module"对象没有属性"CollectiveAllReduceStrategy"。

tensorflow对象检测支持分布式策略吗?如果是,使用或不使用分销策略有什么区别?如果没有,是否有其他方式进行同步训练?

您应该更新tensorflow版本>=1.11

最新更新