浆料设置:连接浆液流套接字时出错



>我正在尝试使用 slurm 设置一个新集群。我已经设置了一个客户端和一个控制机器。 (我是新手...

  1. 当我从控制机器输入 sinfo -vvv 时,它会告诉

" 信息: 调试 2: slurm_connect失败: 连接被拒绝 sinfo: debug2:在 192.168.155.142:6817 处连接 slurm 流套接字时出错:连接被拒绝"

我的 slurm 配置为使用 6817 端口(完整配置可在此处获得 https://pastebin.com/X4yDe99z

SlurmctldPort=6817

端口已打开(我也尝试禁用了 ufw)

6817 (v6) ALLOW Anywhere (v6)

  1. 当我尝试 slurmctld -Dvvv 时,它显示此错误

slurmctld: error: this host (xxxx/xxx) not a valid controller (gaia or (null))

我的/etc/hosts 文件是 127.0.0.1 localhost 192.168.155.142 gaia

slurm.conf 中参数 ControlMachine 的值,即启动slurmctld的计算机,必须是该计算机上hostname -s的确切输出,守护程序才能启动。

似乎您机器上的hostname -s无法输出gaia.将gaia替换为隐藏在xxxx/xxx后面的内容。

最新更新