我正在尝试添加一个警报,如果Azure ML管道失败。看起来其中一种方法是在Azure Portal中创建一个监视器。问题是我找不到正确的信号名称(设置条件时需要),这将识别管道故障。我应该使用什么信号名称?或者如果Azure管道失败,是否有其他方式发送电子邮件?
我应该使用什么信号名称?
您可以使用AmlPipelineEvent
表的PipelineChangeEvent
类别来查看访问(读取,创建或删除)ML管道草案或端点或模块时的事件。
例如,根据文档,使用AmlComputeJobEvent
获取最近五天内失败的作业:
AmlComputeJobEvent
| where TimeGenerated > ago(5d) and EventType == "JobFailed"
| project TimeGenerated , ClusterId , EventType , ExecutionState , ToolType
答:更新
根据Laurynas G:
AmlRunStatusChangedEvent
| where Status == "Failed" or Status == "Canceled"
你可以参考Monitor Azure Machine Learning, Log &查看指标和日志文件以及故障排除机器学习管道