在计算机集群中,我有其中一个计算节点的IP地址。该计算节点在Slurm配置中有一个名称。如何查找Slurm为该计算节点使用的名称?
slurm.conf
中的节点名称必须与hostname -s
命令返回的主机名相对应,并且Slurm期望这些名称解析为正确的ip。
所以你应该可以运行
getent hosts <IP>
得到类似
的内容$ getent hosts 10.1.1.1
10.1.1.1 node001.cluster
在上面的示例中,Slurm所知道的节点名称将是node001
,您可以用scontrol show node node001
来确认。