在GCP AI平台上创建模型版本时出错



我正在尝试创建模型的一个版本,并将其链接到我导出的Tensorflow模型。然而,它给了我以下错误:health probe timeout: generic::unavailable: The fetch failed with status 3 and reason: UNREACHABLE_5xx Check the url is available and that authentication parameters are specified correctly

我已将SaveModel目录公开,并已附加service-xxxxxxxxxxxx@cloud-ml.google.com.iam.gserviceaccount.com使用Storage Legacy bucket Reader到我的存储桶。我的服务帐户service-xxxxxxxxxxxx@cloud-ml.google.com.iam.gserviceaccount.com具有ML引擎管理员和存储管理员的角色。bucket和ml引擎是同一项目和区域us-central1的一部分。我正在用以下配置初始化模型版本:

Python version: 2.7
Framework: TensorFlow
Framework version: 1.12.3
Runtime version: 1.12
Machine type: n1-highmem-2
Accelerator: Nvidia Tesla K-80 
Accelerator count: 1

注意:我在训练和运行时版本1.12 中使用了python 2.7

是否可以使用CLI验证保存的模型是否有效。检查保存的模型中是否有Serving标记集,使用SavedModel CLI:

saved_model_cli show --dir <your model directory>

相关内容

  • 没有找到相关文章

最新更新