当Google Cloud SQL发布服务器升级(到更大的机器)比"a few minutes"花费的时间长得多时该怎么办?



我们将Google Cloud SQL postgres服务器升级到更大的机器,升级不会终止。根据我们的经验,这通常需要不到 5 分钟,但我们已经等待了大约 1.5 小时,没有任何反应。服务器关闭后没有日志(连接尝试失败除外)。我们无法切换到故障转移,因为已经有一个操作正在进行中(即首先导致问题的升级)。重新启动被禁用,因为操作正在进行中。似乎我们现在无能为力,除了可能应用最后一个备份,尽管我们不确定在操作过程中是否可能这样做。

我们可以做些什么来重新启动数据库或解决问题?

升级 CloudSQL 服务器时,实例会重启。 偶尔可能会发生重新启动时间超出预期的情况,这似乎是您的服务器发生的情况,但这不是意外行为。

话虽如此,请务必检查 CloudSQL 服务的状态。如果升级过于频繁或从未完成,请联系支持人员。

要减少再次出现此问题的机会,请执行以下操作:

  • 为您的实例配置高可用性,使其具有故障转移功能。
  • 请确保故障转移副本的维护时段与主实例的维护时段不同。如需更改维护计划,请在 GCP 控制台进入 SQL,单击实例,然后单击"编辑维护计划"->"设置维护计划"。然后选择一个窗口。

相关内容

  • 没有找到相关文章