tensorflow对象检测预训练模型SageMaker部署



我尝试使用下面的指令将EfficientDet模型从tf2对象检测api部署到sagemaker: https://docs.aws.amazon.com/sagemaker/latest/dg/tf.html输入图片描述

和类似于这个示例的笔记本:https://github.com/aws-samples/amazon-sagemaker-tensorflow-object-detection-api/blob/main/3_predict/deploy_endpoint.ipynb

  • 当我试图部署

model = TensorFlowModel(name=name_from_base('tf2-object-detection'), model_data=model_artefact, role=role, framework_version='2.2' )

predictor = model.deploy(initial_instance_count=1, instance_type='ml.m5.xlarge')

我收到以下错误:UnexpectedStatusException: error hosting endpoint tf2-object-detection-2022-05-28-10-46-50-583: Failed。原因:客户:生产变种AllTraffic的主容器未通过ping健康检查。请检查CloudWatch的日志。

是什么导致了这个错误?提前感谢!

更新:当我检查cloud watch时,我发现这个日志错误:

ValueError: no SavedModel bundles found!

我设法解决了这个…问题是我的模型目录结构必须遵循以下格式:

some_name 
|__ Some positive number that represents version (For eg: 1) 
|__ saved_model.pb 
|__ variables 
|__ 

我没有创建一个带有版本号的顶级文件,显然我保存的模型文件不被识别,但添加它解决了这个问题。

相关内容

  • 没有找到相关文章

最新更新