关于官方文件中的燧石水印插图的问题



最近我阅读了flink官方文档中关于水印的内容。

网址:https://ci.apache.org/projects/flink/flink-docs-release-1.9/dev/event_time.html

有两张图片说明了flink水印机制,这让我很困惑:

闪烁水印

第一张图很容易理解,但在第二张图中,我想知道我们如何得到w(11(和w(17(?正如我们所知,我们可以定义如何在flink作业中生成水印,换句话说,水印是根据特定规则生成的。那么,在第二张图片中生成水印的规则是什么呢。

我查找了几乎所有不同版本的官方文件,他们使用了相同的图片。这让我很困惑有什么解释吗

你说得对;那个例子令人困惑。虽然它确实说明了一种可能的情况,但它并不容易理解。

通常,水印是使用有界无序水印策略生成的,其中时间戳分配器跟踪迄今为止看到的最大时间戳(作为在流记录的元数据中分配时间戳的副作用(。然后,每当周期性水印生成器的计时器关闭时(默认情况下每200毫秒(,从该最大时间戳中减去指定的有界延迟,并将结果用于创建新的水印(前提是生成的时间戳大于先前的水印(。

在该图所示的示例中,W(17(之前的最大时间戳似乎是22,因此有界延迟可能是5。因此,根据同样的推理,在W(11(之前的时间16应该有一个事件,但如果有,它就在从时间7开始的事件之前的某个地方。

相关内容

  • 没有找到相关文章

最新更新