自动重试谷物故障转移在微软奥尔良



所以我们正在测试谷物故障转移如何在某些筒仓由于某些原因(服务器关闭等)而无响应的情况下工作。目前,我们有两个筒仓在两台不同的机器上运行,每台机器上都有激活的谷物。然后我们继续杀死其中一个筒仓(出乎意料)。我们尝试在DEAD竖井上调用一个grain,超时后(我认为总共是3分钟左右)抛出一个Exception,表明竖井拒绝连接。现在,我们认为在一个筒仓被宣布为DEAD后,如果我们重试激活,则只有在另一个筒仓上才会激活该谷物。这对我们来说很好。但是,我们想知道是否有某种方法可以自动执行重试,而不是自己执行逻辑。

首先,3分钟听起来太长了。如果您使用默认的活度设置,它应该是几十秒。它是什么系统存储?

如果你想要自动重试,你最好把所有的客户端粒度调用包装在一个包装器中,例如,它将以指数回退方式重试。自己重试可以让您更好地控制重试内容和方式。

最新更新