我的一个主节点在我的dataproc集群中被意外删除。有什么方法可以恢复该主节点吗?或者我可以启动一个新的主节点并将其添加到我的集群中吗?删除的原因仍然未知。
非常感谢您的帮助。
在知道我没有太多选择后,我尝试了以下步骤,并成功了。
- 确定当前活动的NameNode(
hdfs haadmin -getServiceState nn0/nn1
( - 创建当前活动NameNode的AMI
- 从那个AMI中启动一个与已删除主节点名称完全相同的新实例。(这一点至关重要,因为hdfs-site.xml中的所有hdfs属性都是仅使用此主机名配置的。因此,请确保此实例的每个细节都与丢失的细节完全相同。(
我们的AMI包含每一个所需的配置和服务,因此当新实例启动时,dataproc将自动识别节点并将其添加到集群中。
如果它已经被删除,我认为它无法恢复到删除前的任何状态。但是,您可以通过确保它不会被计划删除来防止将来的意外删除。