在分布式 Tensorflow 中,拥有多个参数服务器有什么影响?



当我们有一个由其工作线程更新的参数服务器时,为相同数量的工作线程使用多个参数服务器会产生什么影响?

即,当我们有多个参数服务器而不是一个参数服务器时会发生什么?

谢谢。

这称为具有多个参数服务器分片。这提供了更多细节 https://static.googleusercontent.com/media/research.google.com/en//archive/large_deep_networks_nips2012.pdf,尤其是第 4.1 节

为了将 SGD 应用于大型数据集,我们引入了倾盆大雨 SGD,一种变体 使用多个的异步随机梯度下降 单个DistBelieve模型的副本。基本方法是 如下:我们将训练数据划分为多个子集并运行 每个子集上的模型副本。模型传达 通过集中式参数服务器进行更新,该服务器将 模型所有参数的当前状态,跨多个参数分片 机器(例如,如果我们有 10 个参数服务器分片,则每个分片是 负责存储更新并将其应用于模型的 1/10 参数((图2(

最新更新