Flink 中是否有一种机制可以在作业失败时发送警报/通知?
我在想,如果应用了重启策略,作业可能会知道它正在重启,客户端代码可以向某个接收器发送通知,但找不到任何相关的作业上下文信息
我不知道
有什么超级简单的方法可以做到这一点。几个想法:
(1) 作业管理器知道失败的作业。例如,您可以轮询/joboverview/complete,查找新失败的作业。/jobs/
(2) CheckpointedFunction 接口有一个 initializeState() 方法,该方法传递一个响应 isRerestore() 方法 (docs) 的上下文对象。这或多或少是您正在寻找的相关工作环境。