Flink 文档提到数据流 API 的交付保证恰好一次或至少一次,但是,我没有发现数据集 API 的相同参考。
消息是否保证只传递一次到数据集中的所有转换;此外,在没有检查点机制的情况下,唯一合乎逻辑的方法是从头开始作业?
我可以将数据流 API 用于批处理作业吗,我会失去什么?
此处介绍了数据集 API 的容错能力,是的,它基于重试失败的作业。
您当然可以将数据流 API 用于有限(批处理)作业。有一些功能仅存在于批处理 API 中,例如机器学习和图形库,并且 DataSet API 具有一些不适用于 DataStream 的优化,但对于许多应用程序,差异并不显着。