错误:(gcloud.compute.instances.create)无法获取资源:- 配额'GPUS_ALL_REGIONS'超出。限制:全球 0.0



我想尝试PEGASUS来总结文章。 https://github.com/google-research/pegasus

我按照这个指示。 https://github.com/google-research/pegasus/tree/f76b63c2886748f7f5c6c9fb547456d8c6002562#setup

我检查了我可以使用的区域NVIDIA Tesla V100,我决定使用us-central1-ahttps://cloud.google.com/compute/docs/gpus

我使用了这个命令。

gcloud compute instances create pegasustest --zone=us-central1-a 
--machine-type=n1-highmem-8 --accelerator type=nvidia-tesla-v100,count=1 
--boot-disk-size=500GB --image-project=ml-images --image-family=tf-1-15 
--maintenance-policy TERMINATE --restart-on-failure

我收到此错误消息。

ERROR: (gcloud.compute.instances.create) Could not fetch resource:
- The zone 'projects/covid19agent/zones/us-central1-a' does not have enough 
resources available to fulfill the request.  
Try a different zone, or try again later.

我花了 3 个小时再试一次,但我得到了相同的结果。

因此,我将区域从us-central1-a更改为asia-east1-c

我使用了这个命令。

gcloud compute instances create pegasustest --zone=asia-east1-c 
--machine-type=n1-highmem-8 --accelerator type=nvidia-tesla-v100,count=1 
--boot-disk-size=500GB --image-project=ml-images --image-family=tf-1-15 
--maintenance-policy TERMINATE --restart-on-failure

然后我收到此错误消息。

WARNING: Some requests generated warnings:
- Disk size: '500 GB' is larger than image size: '10 GB'. 
You might need to resize the root repartition manually 
if the operating system does not support automatic resizing. 
See https://cloud.google.com/compute/docs/disks/add-persistent-disk#resize_pd 
for details.
ERROR: (gcloud.compute.instances.create) Could not fetch resource:
- Quota 'GPUS_ALL_REGIONS' exceeded.  Limit: 0.0 globally.

我不可能尝试飞马吗?而且,尝试飞马座是不是花太多钱?

让我们从第一个问题开始。再次查看错误消息:

错误:(gcloud.compute.instances.create(无法获取资源: - 区域"项目/covid19agent/zones/us-central1-a"没有足够的资源来满足请求。 尝试不同的 区域,或稍后重试。

当您启动实例时,它会请求 vCPU、内存、GPU 等资源,如果区域中没有足够的可用资源,您将收到此类消息,文档中提供了更多信息:

如果收到资源错误(如ZONE_RESOURCE_POOL_EXHAUSTED 或ZONE_RESOURCE_POOL_EXHAUSTED_WITH_DETAILS(请求新的 资源,这意味着该区域当前无法容纳您的 请求。此错误是由于计算引擎资源可获取性, 而不是由于您的计算引擎配额。

资源可用性取决于用户请求,因此是动态的。

有几种方法可以解决此问题

  1. 请稍等片刻,然后尝试再次启动 VM 实例(如您所尝试的那样,但这次没有结果(。
  2. 将您的实例移动到另一个区域(就像您所做的那样(。
  3. 按照以下文档为 VM 预留资源,以避免将来出现此类问题:

    为特定虚拟机 (VM( 实例创建预留 区域,使用自定义或预定义的计算机类型,带或不带 额外的 GPU 或本地 SSD,以确保资源可用于 您的工作负载(当您需要它们时(。创建预留后,您 立即开始为保留的资源付费,它们仍然存在 可供您的项目无限期使用,直到预留 被删除。

现在,让我们看一下第二个问题。请再次查看此错误消息:

错误:(gcloud.compute.instances.create(无法获取资源: - 超出配额"GPUS_ALL_REGIONS"。 限制:全局 0.0。

有关配额的详细信息,请参阅文档。

要解决此问题,您应该按照以下步骤操作

  1. 确保为项目启用计费。
  2. 请求增加配额:

    1. 转到"配额"页。
    2. 在"配额"页中,选择要更改的配额。
    3. 单击页面顶部的编辑配额按钮。
    4. 选中要编辑的服务对应的复选框。
    5. 填写您的姓名、电子邮件和电话号码,然后单击下一步。
    6. 输入增加配额的请求,然后单击下一步。
    7. 提交您的请求。
    8. 默认情况下,减少配额的请求将被拒绝。如果必须减少配额,请回复支持电子邮件,并说明 您的要求。来自计算引擎的支持代表 团队将在 24 到 48 小时内回复您的请求。

    如果您使用 12 个月 300 美元的免费试用版,则无法请求增加配额,因为存在以下限制:

    您的免费试用信用额度适用于所有 Google Cloud 资源,并且 以下例外情况:

    • 同时运行的内核(或虚拟 CPU(不能超过 8 个。
    • 无法将 GPU 添加到 VM 实例。
    • 无法请求增加配额。有关计算引擎配额的概述,请参阅资源配额。
    • 不能创建基于 Windows Server 映像的 VM 实例。

    您必须升级您的帐户才能执行 前面的列表。

您可以使用 Google Cloud 定价计算器估算使用成本

我只是通过更改区域解决了此错误。 最初是us-central-c,我改us-central-b

相关内容

  • 没有找到相关文章

最新更新