通过心跳的崩溃容错



我在理论上得到了碰撞容错(CTF(的概念。CTF用于确保系统在leader服务器崩溃的情况下仍在运行。我需要实现一个分布式系统(聊天应用程序(,还需要实现崩溃容错。为此,我不得不使用所谓的";心跳;以检查引导服务器是否仍处于"空闲"状态;生活";。

我的问题是,是否有人可以向我展示一个实现这种心跳的好代码示例?

心跳机制的适用性取决于集群的大小或手头的典型用例/部署场景。

许多基于共识的算法依赖于心跳,因为心跳用于决定领导者或领导者服务器的状态。

raft算法可以参考从领导者服务器向追随者发送心跳的情况,你也可以在领导者崩溃的情况下使用他们的领导者选举机制。

对于大型集群,只有心跳机制可能无法扩展,因此故障检测器以及基于八卦的传播协议是首选。

参考文献很少:https://raft.github.io/,https://github.com/topics/gossip-protocol

最新更新