使用内置的 sagemaker 算法进行增量学习



我正在训练DeepAR AWS SageMaker内置算法。使用 sagemaker SDK,我可以使用指定的特定超参数训练模型:

estimator = sagemaker.estimator.Estimator(
sagemaker_session=sagemaker_session,
image_name=image_name,
role=role,
train_instance_count=1,
train_instance_type='ml.c4.2xlarge',
base_job_name='wfp-deepar',
output_path=join(s3_path, 'output')
)
estimator.set_hyperparameters(**{
'time_freq': 'M',
'epochs': '50',
'mini_batch_size': '96',
'learning_rate': '1E-3',
'context_length': '12',
'dropout_rate': 0,
'prediction_length': '12'
})
estimator.fit(inputs=data_channels, wait=True, job_name='wfp-deepar-job-level-5')

我想以较小的学习率再次训练生成的模型。我遵循了这里描述的增量训练方法:https://docs.aws.amazon.com/en_pv/sagemaker/latest/dg/incremental-training.html,但它不起作用,显然(根据链接(,只有两个内置模型支持增量学习。

有没有人找到解决方法,以便他们可以训练具有预定学习率的内置算法?

不幸的是,SageMaker内置的DeepAR模型不支持学习率调度或增量学习。 如果你想在DeepAR架构上实现学习率平台计划,我建议考虑:

  • 使用开源的DeepAR实现(代码,演示(
  • 或使用Amazon Forecast服务的DeepAR+算法,该服务具有学习率调度功能。

相关内容

  • 没有找到相关文章

最新更新