Flink 数据集 API 交付保证和检查点



Flink 文档提到数据流 API 的交付保证恰好一次或至少一次,但是,我没有发现数据集 API 的相同参考。

消息是否保证只传递一次到数据集中的所有转换;此外,在没有检查点机制的情况下,唯一合乎逻辑的方法是从头开始作业?

我可以将数据流 API 用于批处理作业吗,我会失去什么?

此处介绍了数据集 API 的容错能力,是的,它基于重试失败的作业。

您当然可以将数据流 API 用于有限(批处理)作业。有一些功能仅存在于批处理 API 中,例如机器学习和图形库,并且 DataSet API 具有一些不适用于 DataStream 的优化,但对于许多应用程序,差异并不显着。

最新更新