如果Azure ML管道失败,发送警报



我正在尝试添加一个警报,如果Azure ML管道失败。看起来其中一种方法是在Azure Portal中创建一个监视器。问题是我找不到正确的信号名称(设置条件时需要),这将识别管道故障。我应该使用什么信号名称?或者如果Azure管道失败,是否有其他方式发送电子邮件?

我应该使用什么信号名称?

您可以使用AmlPipelineEvent表的PipelineChangeEvent类别来查看访问(读取,创建或删除)ML管道草案或端点或模块时的事件。

例如,根据文档,使用AmlComputeJobEvent获取最近五天内失败的作业:

AmlComputeJobEvent
| where TimeGenerated > ago(5d) and EventType == "JobFailed"
| project  TimeGenerated , ClusterId , EventType , ExecutionState , ToolType

答:更新

根据Laurynas G:

AmlRunStatusChangedEvent 
| where Status == "Failed" or Status == "Canceled"

你可以参考Monitor Azure Machine Learning, Log &查看指标和日志文件以及故障排除机器学习管道

最新更新