为什么我需要 Container for AWS SageMaker?如果我想在SageMaker的Jupyter笔记本上运行Scikit Learn以进行自学,我还需要为其配置容器吗?
如果我只想学习Scikit Learn,我需要在SageMaker上进行的最低配置是什么?例如,我想使用一组训练数据和一组测试数据运行Scikit Learn的决策树算法。我需要在 SageMaker 上执行哪些操作才能执行这些任务?谢谢。
你不需要太多。只是一个对您的角色具有相关权限的 AWS 账户。 在 AWS SageMaker 控制台中,您只需单击一下即可运行 AWS 笔记本实例。预装了 Sklearn,您可以开箱即用。无需特殊容器。
您至少只需要具有相关权限的 AWS 账户即可创建 EC2 实例并从 S3 读取/写入。仅此而已,请尝试一下。:)
以此为起点:Amazon SageMaker – 加速机器学习
您也可以通过Jupyter终端访问它
如果您不担心使用Sagemaker的训练和部署功能,那么您只需创建一个新的conda_python3
笔记本并导入sklearn。
我也对如何利用Sagemaker的训练/部署功能与Scikit Learn感到困惑。最好的解释和最新的似乎是:
https://github.com/aws/sagemaker-python-sdk/blob/master/src/sagemaker/sklearn/README.rst
简要总结如下:
- 您将训练数据保存到 S3 存储桶。
- 创建一个独立的 python 脚本来执行训练,将训练模型序列化为文件并将其保存到 S3 存储桶。
- 在 Sagemaker 上的笔记本中,导入 Sagemaker SDK 并将其指向您的训练脚本和数据。然后,Sagemaker 将临时创建一个 AWS 实例来训练模型。
- 训练后,该实例将自动销毁。
- 最后,您使用 Sagemaker 开发工具包将训练好的模型部署到另一个 AWS 实例。这还会自动创建一个可调用以进行预测的终结点。