如果我失去了互联网连接并返回内核,如何知道aws sagemaker的训练状态



我在aws Sagemaker Jupyter实验室(p3.2xlarge实例(接受培训,当时是LSTM网络,突然失去了互联网连接,当我恢复互联网连接时返回内核。。我看不到任何训练时期的更新。

有人知道吗?我可以通过终端访问内核中正在处理的内容吗?这样我就可以知道训练状态了。

您可以使用CloudWatch查看日志。要到达那里,请转到SageMaker侧边栏,然后下拉"培训"部分,然后选择"培训工作"。你应该在那里看到你的培训工作列表。单击正在进行的作业,然后向下滚动到监视器部分。在那里,您应该可以看到查看日志的选项。

我知道你现在很有可能已经明白了,但我回答了,以防有人遇到同样的问题,就像我一样。

最新更新