如何在dataproc集群中恢复已删除的主节点



我的一个主节点在我的dataproc集群中被意外删除。有什么方法可以恢复该主节点吗?或者我可以启动一个新的主节点并将其添加到我的集群中吗?删除的原因仍然未知。

非常感谢您的帮助。

在知道我没有太多选择后,我尝试了以下步骤,并成功了。

  1. 确定当前活动的NameNode(hdfs haadmin -getServiceState nn0/nn1(
  2. 创建当前活动NameNode的AMI
  3. 从那个AMI中启动一个与已删除主节点名称完全相同的新实例。(这一点至关重要,因为hdfs-site.xml中的所有hdfs属性都是仅使用此主机名配置的。因此,请确保此实例的每个细节都与丢失的细节完全相同。(

我们的AMI包含每一个所需的配置和服务,因此当新实例启动时,dataproc将自动识别节点并将其添加到集群中。

如果它已经被删除,我认为它无法恢复到删除前的任何状态。但是,您可以通过确保它不会被计划删除来防止将来的意外删除。

相关内容

  • 没有找到相关文章

最新更新