Flink 中数据集上的异步 I/O 等效于什么?对于DataStream,它基本上是AsyncDataStream。
在映射函数中执行阻塞调用?
他们有什么最佳实践吗?
我会用一个RichMapPartitionFunction
来实现它,它提供了一个对输入的迭代器和一个收集器来发出结果。
由于数据集 API 不需要与检查点机制集成并遵循记录和时间戳的顺序,因此尽管MapPartitionFunction
不提供任何特定于异步的工具,但实现不应涉及太多内容。