监视slum作业中每个节点的内存使用情况



我的slurm作业使用了几个节点,我想知道每个节点在运行作业中的最大内存使用量。我能做什么?

现在,我可以对每个节点进行ssh并执行free -h -s 30 > memory_usage,但我认为必须有更好的方法。

Slurm记帐将直接为您提供所有任务的最大内存使用量。如果这些信息还不够,您可以按照本文档设置评测,您将从Slurm收到每个进程在作业期间的全部内存使用情况,作为时间序列。然后,您可以聚合每个节点,找到最大值等。

最新更新