我需要限制在HPC集群中运行的并发作业的数量。
最好的方法是什么?
你不能。
您可以使用"排队"调度,按照队列的顺序运行作业。如果第一个作业没有使用所有的内核,那么另一个作业也会启动(以此类推)。
或者您可以使用"Balanced",它以最小的资源需求同时运行尽可能多的作业。然后根据作业的优先级在作业之间共享剩余的资源。
如果你需要限制同时工作的数量(而不是任务的数量),那么我猜你在其他地方有瓶颈。我会努力解决瓶颈