>我正在运行一个查询来连接一个流和一个表,如下所示。堆空间不足。即使它在 flink 集群中有足够的堆空间 (60GB * 3(
此查询是否需要驱逐策略?
SELECT sourceKafka.* FROM sourceKafka INNER JOIN DefaulterTable ON sourceKafka.CC=DefaulterTable.CC;
如果要与流联接的表是静态的,则可以实现自己的联接,该联接的行为会更好。
一种方法是使用状态处理器 API 创建一个将静态表置于 Flink 状态的保存点,然后将连接实现为 KeyedProcessFunction。
如果您需要定期更新"静态"表,那么使用 KeyedCoProcessFunction 并在偶尔更新中进行流式处理应该是可行的。