我想知道在 Apache Flink 中的摄取时间配置的情况下使用哪个挂钟。
在这里,我们读到摄取时间"在记录到达系统(源头)后立即将挂钟时间戳分配给记录"。
如果源是非并行的,我想与传入元组关联的时间戳是完全有序的,但是如果我使用并行源函数怎么办?
是否可以并行源在 2 台不同的机器上运行,从而可以使用 2 个不同的挂钟作为时间戳?
提前谢谢你
相应机器的挂钟时间用作时间戳。因此,如果计算机的时钟未正确同步,您可能会获得多个不同的时间戳。
更新
如果多个源在不同的计算机上执行,这也适用于多个源。每个源将使用运行它的计算机的时钟来分配时间戳。