我已经使用Docker容器部署了一个AWS端点(我遵循了这一点(。
一切都很完美,但现在我需要将其投入生产,并定义一个自动扩展策略。
我尝试了两件事:
-
AWS控制台,但自动缩放按钮为灰色出来
-
此处描述的方法。我的端点名称是
EmbeddingEndpoint
,而我的变体名称是SimpleVariant
。所以我的最后的命令是
aws application-autoscaling put-scaling-policy
--policy-name scalable_policy_for_embedding
--policy-type TargetTrackingScaling
--resource-id endpoint/EmbeddingEndpoint/variant/SimpleVariant
--service-namespace sagemaker
--scalable-dimension sagemaker:variant:DesiredInstanceCount
--target-tracking-scaling-policy-configuration file://policy_config.json
但我得到的结果是:
An error occurred (ObjectNotFoundException) when calling the PutScalingPolicy operation:
No scalable target registered for service namespace: sagemaker, resource ID:
endpoint/EmbeddingEndpoint/variant/SimpleVariant, scalable dimension:
sagemaker:variant:DesiredInstanceCount
有人有其他解决方案吗,还是我没有很好地设置变量?提前谢谢!
您的sagemaker
服务命名空间没有任何注册的扩展目标。在运行put-scaling-policy
之前,您需要先运行register-scalable-target
。
aws application-autoscaling register-scalable-target
--service-namespace sagemaker
--scalable-dimension sagemaker:variant:DesiredInstanceCount
--resource-id endpoint/EmbeddingEndpoint/variant/SimpleVariant