在SageMaker中检索给定模型包组的模型端点



给定模型包组名称和模型包,我希望实现一个API,该API将返回该模型包的最新版本的端点。

对于给定的模型包和特定的版本,Java SDK中的API是什么?

澄清更新:模型包(及其版本(已经部署。API的目的是检索已经存在的端点,我不知道如何在Java中做到这一点。

在Python中,它将类似于:

model_artifact_summary = list(Artifact.list(source_uri=model_package_arn))[0]
model_artifact = ModelArtifact.load(artifact_arn=model_artifact_summary.artifact_arn)
endpoints = model_artifact.endpoint_contexts()

但我不知道Java的等价物。

从一个模型包组中,您可以创建一个可部署的模型。使用您创建的SageMaker模型实体,您将希望创建端点配置:这是端点、实例类型和实例计数等的详细信息。使用此端点配置,您可以创建端点。这两个步骤可以通过控制台或您选择的SDK进行编排。

创建Endpoint Config Java API调用:https://sdk.amazonaws.com/java/api/latest/software/amazon/awssdk/services/sagemaker/model/CreateEndpointConfigResponse.html

创建端点Java API调用:https://sdk.amazonaws.com/java/api/latest/software/amazon/awssdk/services/sagemaker/model/CreateEndpointResponse.html

Java SDK SageMaker客户端文档:https://sdk.amazonaws.com/java/api/latest/software/amazon/awssdk/services/sagemaker/SageMakerClient.html

最新更新