在使用 AWS Sagemaker 基本事实为一个任务指定多个源时,如何编辑清单



我想创建一个任务,让一个工作人员使用 AWS Sagemaker 基本事实对多个声源进行标记。 我创建了一个清单文件,如下所示,但我无法使用 source-ref 指定多个声源。 如何创建清单文件?

dataset.manifest

{"source-ref":["s3://sagemaker-sample/audio_01.wav", "s3://sagemaker-sample/audio_02.wav"]}

错误

ClientError: Manifest: s3://sagemaker-sample/dataset.manifest 有 第 0 行处的格式无效。确保源或源引用 字段包含字符串值

不支持将多个源指定为单个"source-ref"下的列表。有关实际格式,请参阅 https://docs.aws.amazon.com/sagemaker/latest/dg/sms-input-data-input-manifest.html。每行表示对单个 S3 文件的引用,如下所示。 例:

{"source-ref": "S3 bucket location 1"}
{"source-ref": "S3 bucket location 2"}
...
{"source-ref": "S3 bucket location n"} 

对于您的情况,这将是

{"source-ref": "s3://sagemaker-sample/audio_01.wav"}
{"source-ref": "s3://sagemaker-sample/audio_02.wav"}

最新更新