Google 云负载均衡器会不均匀地分配流量



我创建了包含 3 个实例和 HTTP/2 类型的 GCP 负载均衡器的实例组。当我命中负载均衡器的 IP 时,请求会随机分布,例如我击中了 12 个请求,因为有 3 个实例,负载分配应该是每个 VM 4 个,但它不会在循环中发生。我是否有可能在 GCP 中实现这一目标?

GCP 负载平衡使用的算法旨在根据客户端的地理位置分配负载。如果一个区域中为多个可用区配置了后端,则流量将根据每个组的容量分布在每个可用区的实例组之间。

仅当您创建由同一区域中的实例组成的后端时,才会存在轮循机制算法;在这种情况下,请求将均匀分布在实例上。

除了循环,GCP 有两种模式

  1. 实例组或 NEG 的 RATE 是每秒目标最大请求(查询(数(RPS、QPS(。当所有后端都达到或超过容量时,可以超过目标最大 RPS/QPS。
  2. 利用率
  3. 是实例组中虚拟机的后端利用率

流量在后端之间的分配方式取决于负载均衡器的模式。

来自 GCP 文档

对于这两种模式,容量估计和主动分配会影响实例之间的分布。因此,云负载平衡的行为与简单的轮询负载均衡器不同,后者在两个实例之间精确地以 50:50 的比例分配请求。相反,Google Cloud 负载均衡会尝试针对每个请求优化后端实例选择。

从这里阅读完整文档

最新更新