Flink Streaming作业执行图分析



我对Flink、的性能有一些疑问

如果我的程序有一个与下图相同的执行计划,有人能告诉我出了什么问题吗?

谢谢。

在此处输入图像描述

根据您的描述,我无法立即理解为什么每个源需要多个hash。任何类型的网络混洗都会限制吞吐量,因此避免所有不必要的混洗似乎是您的最佳解决方案。

最后的图片应该看起来像

Source 1 --

Source 2 ----
+---> Map ---> Sink
...          /
/
Source N --/

使得每个输入记录只被重新激活一次。

除了这些一般性的考虑之外,我还需要更多的细节和CEP伪代码来给出更具体的建议。

最新更新