tensorflow对象检测支持分布式策略吗

系统信息

您正在使用的模型的顶级目录是什么：对象检测
我是否编写了自定义代码(而不是使用TensorFlow中提供的股票示例脚本(：否
操作系统平台和发行版(例如Linux Ubuntu 16.04(：Centos 7.5
TensorFlow安装自(源或二进制(：源
TensorFlow版本(使用下面的命令(：1.9.0
Bazel版本(如果从源代码编译(：0.19
CUDA/cuDNN版本:9.0
GPU型号和内存：Titan 1080 Ti/8G
复制的确切命令：否
分布式环境：2台机器，每台8个GPU

描述问题

我想进行一个关于物体检测的分布式训练。首先，我只需在命令中设置"TF_CONFIG"就可以运行文件"model_main.py"，它运行得很顺利。这是进行分布式培训的正确方法吗？但这种方式似乎是一种异步训练。为了运行同步训练，我将"RunConfig"配置为blow，正如它在Distribution Strategy：中提到的那样

config = tf.estimator.RunConfig(train_distribute=tf.contrib.distribute.CollectiveAllReduceStrategy())

据报道：

属性错误："module"对象没有属性"CollectiveAllReduceStrategy"。

tensorflow对象检测支持分布式策略吗？如果是，使用或不使用分销策略有什么区别？如果没有，是否有其他方式进行同步训练？

您应该更新tensorflow版本>=1.11

系统信息

描述问题

相关内容

最新更新

热门标签：