如何创建Slurm分区



我正在尝试构建一个集群,但我被困在slurm分区部分。我确实创建了一个帐户和一个用户,但是我不知道如何创建一个分区来将其分配给一个帐户。我使用的是Bright Computing,所以它会自动安装SLURM并创建一个名为defq的分区。如果有人提供了创建分区并将其分配给帐户的命令示例,那将非常有帮助。如果我有任何误解,请纠正我。

感谢

在slurm.conf文件中,通常在/etc/slurm. conf中找到通常,您将编辑此文件并将其分发到集群中的所有节点。添加节点时,需要重新启动surmctld进程。文档在slurm.schedmd.com/slurm.conf.html#lbAI

例如:PartitionName=debug Nodes=node[1-4] MaxTime=1800 AllowGroups=users State=UP Default=NO

这一行将允许作为组users成员的用户访问调试分区,其中node1 node2 node3 node4可用于作业。

指定的节点必须在slurm.conf中的node语句中定义。文档在slurm.schedmd.com/slurm.conf.html#lbAE

NodeName=node[1-4] cpu =24 Sockets=2 CoresPerSocket=12 ThreadsPerCore=1 RealMemory=1000000 TmpDisk=40000 State=UNKNOWN

您希望指定的资源与每台/所有机器匹配。

祝你好运,Endo

相关内容

  • 没有找到相关文章

最新更新