我想在Google Cloud中使用可抢占的VM实例,但有时会遇到供应问题,尤其是GPU
有什么方法可以找出哪个数据中心区域通常对某些(可抢占的(资源具有最佳可用性?
由于数据中心的平均负载应该符合谷歌的兴趣,我想知道为什么没有这样的工具可以轻松使用。我至少找不到一个。
要了解不同地区GPU的可用性,请参阅文档。
此外,有时您面临"供应问题"的错误是由于配额造成的,因为关于配额,GCP中的大多数项目都将其设置为0,以避免滥用资源,您可以使用控制台请求增加配额。使用GPU部署时的错误意味着您选择的区域具有您选择的机器类型的资源,并且您只需要将所有区域中的GPU限制为1即可继续。您可以随时为所有地区的GPUS申请额外的配额限制。
连接到可抢占实例的GPU与普通GPU一样工作,但只在实例的生命周期内持续存在。考虑请求专用的可抢占GPU配额用于可抢占实例上的GPU。