我尝试使用下面的指令将EfficientDet模型从tf2对象检测api部署到sagemaker: https://docs.aws.amazon.com/sagemaker/latest/dg/tf.html输入图片描述
和类似于这个示例的笔记本:https://github.com/aws-samples/amazon-sagemaker-tensorflow-object-detection-api/blob/main/3_predict/deploy_endpoint.ipynb
- 当我试图部署
model = TensorFlowModel(name=name_from_base('tf2-object-detection'), model_data=model_artefact, role=role, framework_version='2.2' )
predictor = model.deploy(initial_instance_count=1, instance_type='ml.m5.xlarge')
我收到以下错误:UnexpectedStatusException: error hosting endpoint tf2-object-detection-2022-05-28-10-46-50-583: Failed。原因:客户:生产变种AllTraffic的主容器未通过ping健康检查。请检查CloudWatch的日志。
是什么导致了这个错误?提前感谢!
更新:当我检查cloud watch时,我发现这个日志错误:
ValueError: no SavedModel bundles found!
我设法解决了这个…问题是我的模型目录结构必须遵循以下格式:
some_name
|__ Some positive number that represents version (For eg: 1)
|__ saved_model.pb
|__ variables
|__
我没有创建一个带有版本号的顶级文件,显然我保存的模型文件不被识别,但添加它解决了这个问题。