如何查找Slurm集群中计算节点的名称?



在计算机集群中,我有其中一个计算节点的IP地址。该计算节点在Slurm配置中有一个名称。如何查找Slurm为该计算节点使用的名称?

slurm.conf中的节点名称必须与hostname -s命令返回的主机名相对应,并且Slurm期望这些名称解析为正确的ip。

所以你应该可以运行

getent hosts <IP>

得到类似

的内容
$ getent hosts 10.1.1.1
10.1.1.1       node001.cluster

在上面的示例中,Slurm所知道的节点名称将是node001,您可以用scontrol show node node001来确认。

最新更新