是否可以事先识别谷歌计算引擎onHost错误以执行一些重启前任务



是否可以事先识别谷歌计算引擎onHost error以执行一些重启前/重启后的任务。

  • 如果是这样,监视此事件的过程是什么?

不,这是不可能的,因为主机错误可能是预期事件。这种情况应该很少见,但是当它发生时,您无法采取任何行动。

请记住,即使它在"云"中的实例中,也有一台物理机器正在运行您的工作负载,如果不幸出现硬件故障或虚拟化环境,您也无能为力。

更清楚的是,不可能在"onHost 故障"发生前 60 分钟收集通知,例如,您可以在维护期间无法实时迁移虚拟机时执行此操作。


引用文档

主机错误表示托管虚拟机的物理计算机上存在硬件或软件问题,导致虚拟机崩溃。当 Compute Engine 检测到此类事件时,我们会将 compute.instances.hostError 条目添加到您的操作日志中。如果您的虚拟机设置为自动重启(默认设置(,Google 也会在其他物理机上重启您的虚拟机。

通常,物理硬件故障和软件故障可能会不时发生,但很少发生。要保护您的应用程序和服务免受此类潜在破坏性系统事件的影响,请确保设计可靠的系统并构建可缩放且可复原的 Web 应用程序。使用托管实例组跨计算引擎实例组执行运行状况检查和缩放。

更新

计算引擎提供实时迁移,即使在发生主机系统事件(如软件或硬件更新(时也能保持虚拟机实例运行。

实时迁移使您的实例在以下期间保持运行:

硬件故障,如内存、CPU、网络接口卡、磁盘、电源等。这是在尽力而为的基础上完成的;如果硬件完全出现故障或以其他方式阻止实时迁移,则 VM 崩溃并自动重新启动,并记录主机错误。

最新更新