我正试图在计算引擎上创建一个GPU实例(n1-standard-2
和1个NVIDIA T4 GPU(,从昨天开始我就收到了这个错误:
Operation type [insert] failed with message "The zone 'projects/deep-learning-xxxx/zones/us-central1-a' does not have enough resources available to fulfill the request. Try a different zone, or try again later."
谷歌云的这个区域似乎没有足够的GPU资源,但在尝试了多次之后,我在其他区域也遇到了同样的错误。不过,常规的非GPU实例运行良好。我正在努力弄清楚我是做错了什么,还是现在对GCP上的GPU实例有巨大的需求。
没有在特定区域/区域的VM上创建GPU的原因可能是,
1.资源不可用。请在此处查看资源可用性跨地区和区域的GPU可用性。
2.配额过度使用会限制GPU的创建。有关详细信息,请参阅检查项目配额。
3.GCP限制较少,您可以参考此处的限制列表。
您可以使用GPU的在创建虚拟机中检查GPU配额
或者,GCP提供了一个名为"保留计算引擎区域资源"的功能,以确保您的项目拥有可供未来使用的资源。
最后,我能够毫无问题地启动可抢占GPU实例。因此,谷歌云目前似乎没有足够的GPU资源来预订按需GPU虚拟机。