我想尝试PEGASUS来总结文章。 https://github.com/google-research/pegasus
我按照这个指示。 https://github.com/google-research/pegasus/tree/f76b63c2886748f7f5c6c9fb547456d8c6002562#setup
我检查了我可以使用的区域NVIDIA Tesla V100
,我决定使用us-central1-a
https://cloud.google.com/compute/docs/gpus
我使用了这个命令。
gcloud compute instances create pegasustest --zone=us-central1-a
--machine-type=n1-highmem-8 --accelerator type=nvidia-tesla-v100,count=1
--boot-disk-size=500GB --image-project=ml-images --image-family=tf-1-15
--maintenance-policy TERMINATE --restart-on-failure
我收到此错误消息。
ERROR: (gcloud.compute.instances.create) Could not fetch resource:
- The zone 'projects/covid19agent/zones/us-central1-a' does not have enough
resources available to fulfill the request.
Try a different zone, or try again later.
我花了 3 个小时再试一次,但我得到了相同的结果。
因此,我将区域从us-central1-a
更改为asia-east1-c
。
我使用了这个命令。
gcloud compute instances create pegasustest --zone=asia-east1-c
--machine-type=n1-highmem-8 --accelerator type=nvidia-tesla-v100,count=1
--boot-disk-size=500GB --image-project=ml-images --image-family=tf-1-15
--maintenance-policy TERMINATE --restart-on-failure
然后我收到此错误消息。
WARNING: Some requests generated warnings:
- Disk size: '500 GB' is larger than image size: '10 GB'.
You might need to resize the root repartition manually
if the operating system does not support automatic resizing.
See https://cloud.google.com/compute/docs/disks/add-persistent-disk#resize_pd
for details.
ERROR: (gcloud.compute.instances.create) Could not fetch resource:
- Quota 'GPUS_ALL_REGIONS' exceeded. Limit: 0.0 globally.
我不可能尝试飞马吗?而且,尝试飞马座是不是花太多钱?
让我们从第一个问题开始。再次查看错误消息:
错误:(gcloud.compute.instances.create(无法获取资源: - 区域"项目/covid19agent/zones/us-central1-a"没有足够的资源来满足请求。 尝试不同的 区域,或稍后重试。
当您启动实例时,它会请求 vCPU、内存、GPU 等资源,如果区域中没有足够的可用资源,您将收到此类消息,文档中提供了更多信息:
如果收到资源错误(如ZONE_RESOURCE_POOL_EXHAUSTED 或ZONE_RESOURCE_POOL_EXHAUSTED_WITH_DETAILS(请求新的 资源,这意味着该区域当前无法容纳您的 请求。此错误是由于计算引擎资源可获取性, 而不是由于您的计算引擎配额。
资源可用性取决于用户请求,因此是动态的。
有几种方法可以解决此问题:
- 请稍等片刻,然后尝试再次启动 VM 实例(如您所尝试的那样,但这次没有结果(。
- 将您的实例移动到另一个区域(就像您所做的那样(。
-
按照以下文档为 VM 预留资源,以避免将来出现此类问题:
为特定虚拟机 (VM( 实例创建预留 区域,使用自定义或预定义的计算机类型,带或不带 额外的 GPU 或本地 SSD,以确保资源可用于 您的工作负载(当您需要它们时(。创建预留后,您 立即开始为保留的资源付费,它们仍然存在 可供您的项目无限期使用,直到预留 被删除。
现在,让我们看一下第二个问题。请再次查看此错误消息:
错误:(gcloud.compute.instances.create(无法获取资源: - 超出配额"GPUS_ALL_REGIONS"。 限制:全局 0.0。
有关配额的详细信息,请参阅文档。
要解决此问题,您应该按照以下步骤操作:
- 确保为项目启用计费。
-
请求增加配额:
- 转到"配额"页。
- 在"配额"页中,选择要更改的配额。
- 单击页面顶部的编辑配额按钮。
- 选中要编辑的服务对应的复选框。
- 填写您的姓名、电子邮件和电话号码,然后单击下一步。
- 输入增加配额的请求,然后单击下一步。
- 提交您的请求。
- 默认情况下,减少配额的请求将被拒绝。如果必须减少配额,请回复支持电子邮件,并说明 您的要求。来自计算引擎的支持代表 团队将在 24 到 48 小时内回复您的请求。
如果您使用 12 个月 300 美元的免费试用版,则无法请求增加配额,因为存在以下限制:
您的免费试用信用额度适用于所有 Google Cloud 资源,并且 以下例外情况:
- 同时运行的内核(或虚拟 CPU(不能超过 8 个。
- 无法将 GPU 添加到 VM 实例。
- 无法请求增加配额。有关计算引擎配额的概述,请参阅资源配额。
- 不能创建基于 Windows Server 映像的 VM 实例。
您必须升级您的帐户才能执行 前面的列表。
您可以使用 Google Cloud 定价计算器估算使用成本。
我只是通过更改区域解决了此错误。 最初是us-central-c
,我改us-central-b
。