不同可用性集中的容错/更新域



每个 AV 集都包含多个从零开始编号的故障/更新域,每个域都是 AWS 术语中的其他机架/AV 区域。

不同 AV 组中的相同域号是否对应于相同的机架/AV 区域?

我想在不同的 AV 集中为 VM(实际上是不同的帐户)分配不同的域。如果第 1 个 VM 在AV_SET1设置的域 0 中,而第 2 个 VM 在AV_SET2的域 1 中,这是否意味着它们确实具有不同的电源等?

谢谢。

想象一下,一个有 100,000 台服务器的房间,分布在几千个机架上。您显然无法从单个数字中识别它们。(这显然是假设,但对于他们较大的数据中心之一 - 甚至是较小的数据中心之一,这并不是一个不合理的假设!

在 AWS 中,可用区相当于用于谨慎部署服务器的单独构建,可以指定将服务器部署到哪个区域。

Azure 没有可指定区域的概念。您将获得一个区域,该区域通常在该区域中有多个站点(类似于 AWS 区域)

可用性集

将存在于单个区域中,启动的下一个可用性集可能位于该区域中,也可能不在该区域中。没有办法知道,也没有办法指定。

区域内的机架被视为故障域。未指定数量的机架将成为图章。图章是计算、存储和网络服务的单位。未指定数量的标记将成为升级域。

可能存在大量小型升级域或少量大型升级域。很少有文档清楚地描述了这个系统(大部分信息都是从各种MS员工使用内部MS信息创建的视频中收集的)

但是,这些以个位数或两位数计算似乎令人难以置信,因为如果更新失败,这将使大量服务器面临风险。

假设更新是用 x+1 容量执行的,这意味着如果有 20 个更新域,它们将需要 5% 的容量闲置,以便在更新失败时占用闲置时间。当你谈论数以万计的服务器时,这是没有意义的。

所以很明显,将会有数千个容错域。 以及"大量"更新域。

关于容错/更新域的唯一保证是它们存在于 AV 中,没有理由相信 AV1 中域 0 中的虚拟机与 AV2 中域 1 中的虚拟机不在同一台物理机上,或在同一机架中,或位于同一标记中, 或在同一区域中。

在设计解决方案时考虑到这一点更有意义。单个故障可能会关闭不同 AV 中的单独域

非常希望能够为我在这里所说的内容提供一些引用,但其中大部分来自我在构建 Azure 的这些年中看到的视频和文档片段。所以我在这里所说的一切都可能完全是虚构的!

不同 AV 集中的相同域号是否对应于 相同的机架/视音频区域?

否。您将始终看到 FD0 和 FD1(对于 ARM 部署 - FD2)。Azure 区域可能具有更多 FDS,但这是基础结构的内部组织,客户不对此负责,也无法影响。

容错域描述硬件边界。是单机架,还是成套机架,没人能告诉你。但请放心,当您将工作负载正确组织到 AV 集中,每个 AV 集中至少有 2 个 VM,您将获得承诺的 SLA 99.95%。

有趣的是,希望控制不同AV集中的VM放置背后的动机和驱动因素是什么。

不要幻想 - 将单个虚拟机部署到 AV 集不会授予 99.95% 的 SLA。

最新更新