有 2 个与保存点相关的 REST API:
-
POST/jobs/:jobid/savepoints,触发异步保存点操作并返回触发器 ID。
GET/jobs/: jobid/savepoints/:triggerid,它通过触发器 ID 返回操作的状态。
但是在分布式系统中,如果操作启动成功,但响应丢失(例如,由于网络问题),那么触发器ID丢失,就没有办法找出操作的状态怎么办?
想知道有没有办法列出 Flink 保存点操作? 这样我就可以获取触发器 ID,然后获取操作状态。
我知道的唯一方法(除了迭代保存点目录)是使用 rest 接口获取检查点历史记录并过滤掉保存点:https://ci.apache.org/projects/flink/flink-docs-stable/monitoring/rest_api.html#jobs-jobid-checkpoints
缺点:你只能得到最后 10 个检查点:-(