谷歌云平台:使用GPU监控时权限被拒绝



我没有发现关于这个问题的问题。我正在尝试按照此处的说明将 GPU 监控添加到我的 vm 实例:https://cloud.google.com/compute/docs/gpus/monitor-gpus。然而,当我尝试启用 GPU 代理时,我收到此错误:/lib/systemd/system/gpu_utilization_agent.service: Permission denied.
有人以前遇到过此问题或知道如何解决?是什么真正拒绝了我访问什么?

您似乎在 Cloud shell 中运行这些步骤,它需要在 VM 上运行这些步骤。

您可以尝试按照Medium创建的这篇关于"在Google Cloud Platform的Stackdriver中启用自定义GPU指标"的文章,这可能是查看更多详细信息和添加或删除GPU文档的好地方。

我遇到了同样的问题并解决了。

你可以查看/lib/systemd/system/的权限

$ ls -ld /lib/systemd/system/
drwxr-xr-x 22 root root 36864 Nov  6 09:49 /lib/systemd/system/

所以你暂时需要写权限。因为你要写/lib/systemd/system/gpu_utilization_agent.service

sudo chmod 777 /lib/systemd/system

写完gpu_utilization_agent.service后,你可以改回权限。

sudo chmod 755 /lib/systemd/system

你可能需要sudo来运行systemctl。

sudo systemctl daemon-reload
sudo systemctl --no-reload --now enable /lib/systemd/system/gpu_utilization_agent.service

最新更新