我制作了一个 Flink 的会话窗口来跟踪访问者在我的网站中的 URL。它在开始不活动(会话间隔)开始 5 分钟后结束
Flink 是否支持某些 API 在不逐个会话间隙完成会话的情况下读取活动窗口中的数据?
FlinkDataStream
中的Windows非常灵活。例如,您可以定义一个自定义Trigger
,该在将记录添加到窗口或特定持续时间(如每分钟)后发出更新的结果。如果实现发出早期结果的Trigger
,则需要实现下游运算符或逻辑,以便它能够处理更新的结果。
如果使用事件时间会话窗口,则应注意会话窗口可能会合并,即,根据会话间隙和记录中时间戳的最大无序性,当收到介于两者之间的记录并"连接"它们时,可能会合并两个会话窗口。在这种情况下,检测更新的逻辑需要更加复杂一些。