里德-所罗门奇偶校验困境:数据分片与奇偶校验分片



假设一个60 drives over 5 nodes集群,每个节点包含 12 个驱动器。

什么更安全?

6 个驱动器数据分片 + 2 个奇偶校验分片 = 8 个驱动器

8 个驱动器数据分片 + 2 个奇偶校验分片 = 10 个驱动器

9 个驱动器数据分片 + 3 个奇偶校验分片 = 12 个驱动器

16 个驱动器数据分片 + 4 个奇偶校验分片 = 20 个驱动器

  • 针对单个磁盘故障提供保护的更好方法是什么?
  • 防止单节点故障的更好方法是什么?

另外,如果您要构建此迷你集群,您会选择什么奇偶校验?

以上两种配置中哪一种更多:

  • 耐用?
  • 强大的?

顺便说一句,我正在与蓝店一起使用 ceph。请随时批评。

我意识到我要向集群添加另一个节点,然后每个节点运行 8+2 以最大限度地提高持久性和可用性。

单个节点发生故障的几率是 1/6,即使节点出现故障也是如此。它将删除 8 个数据 + 2 个奇偶校验分片。

在 CEPH 中,数据可以分布,以便没有节点为一段数据拥有超过 2 个奇偶校验分片的数据。

这将允许一个节点关闭,最多关闭 2 个奇偶校验分片或 2 个数据分片。虽然这会给重建奇偶校验的系统带来压力,但它是相当安全的。

更安全的选择是降至 6 + 2,但这为我的用例浪费了太多数据。

我会发布概率,但它们是在 excel 中完成的,我不知道如何在此处上传 excel。

最新更新