管理节点更改导致的命令失败



我注意到,很多时候我们都会遇到一个瞬态问题,即ADX集群上运行的任何东西都会由于以下错误而突然失败:-

ADX async command has completed with a 'Abandoned' state. Status: 'Admin node has changed'

这在长时间运行的命令的情况下最为常见,这显然是因为在命令执行的生命周期内,管理节点发生更改的概率会增加。这是ADX集群的标准行为吗?我们必须考虑到这种情况有时会发生。有没有关于这种情况发生频率的任何指导,或者关于哪些情况导致该管理节点更改的任何提示。至于管理节点实际更改的时间,我们能做些什么来避免它导致的命令失败吗?

管理节点可能偶尔会发生更改(例如,一周一次(,但预计不会频繁发生。

如果这种情况在集群中频繁发生,则可能表明使用模式存在问题,导致管理节点过载、SKU选择不当(没有足够的CPU/RAM来处理工作负载(,或者服务或底层平台出现问题。

  • 如果你不确定是哪一个,你可以考虑开一张支持票

附带说明,不鼓励使用长时间运行的命令(例如5-10分钟或更长时间(。您应该遵循文档中的注释,建议将单个命令拆分为多个(较短/较轻(命令,每个命令处理要完成的工作的子集。

最新更新