如何在执行 RLlib 算法的同时获取 Ray 集群上的全部 CPU 使用率?



我正在尝试在射线集群上运行rllib算法。我收到以下消息: "此节点上的内存使用情况:20.8/64.4 GB">

我该如何让它充分利用内存?如何交叉检查GPU或CPU利用率是否在90%以上?

请帮忙....

您通常可以使用top检查 CPU 利用率,并使用nvidia-smi检查 GPU 利用率。您可能不希望内存利用率为 100%,因为这样内存就会耗尽。

最新更新