GCLOUD DataProc群集更新 - 如何删除阻止成功命令运行的待处理更新



在我的Google DataProc群集中,我尝试通过退役一个数据码来动态调整群集的大小。执行的群集更新具有工人数量,以将群集的大小减少到1-Master和5个工人,但在2小时内尚未完成。

ERROR: (gcloud.dataproc.clusters.update) FAILED_PRECONDITION: Cannot update cluster 'my-cluster-dev' while it has other pending update operations.

我锁定了我的计算机,以某种方式丢失了命令壳,群集仍然在更新状态中显示出来,因此阻止了我执行任何操作。我现在花了大约5个小时,仍然无法执行任何命令或访问群集。

gcloud dataproc clusters describe my-cluster-dev
projectId: my-project-id-dev
status:
  state: UPDATING
  stateStartTime: '2019-02-22T12:30:02.084Z'
statusHistory:

任何人都可以帮助我解决杀死该过程的方式,该过程使我的群集陷入了更新状态,以便我可以在集群上执行其他任务?

为了减少群集中的节点数量,您采取了哪些步骤?目前尚不清楚您通过"通过退役一个数据码来动态调整群集大小"的意思。您是说" gcloud dataproc群集更新my-cluster-dev -num-masters = 1 -num-workers = 5"当my-cluster-dev有6个节点,并且它被粘在更新状态或是否有任何状态您执行的其他操作?

也有同样的问题。试图更新工人的数量,并陷入"更新"状态。像OP一样,主节点的手动停止/开始解决了问题。

最新更新