在使用Kinesis Analytics几周后,我有一堆问题:
-
它有水印之类的东西吗?像在flink
正如我所发现的,即使是交错窗口也是基于实时发射的:
记录按一分钟的交错窗口分组。参差当应用程序接收到第一条AMZN记录时,窗口启动(ROWTIME为11:00:20)。1分钟交错窗口到期时(11:00:20){我想这可能是打字错误,应该是11:01:20},结果落在交错窗口内的记录(基于在ROWTIME和EVENT_TIME上)写入输出流。使用交错窗口,所有带有ROWTIME和EVENT_TIME的记录在一分钟窗口内以单个结果发射。采取此处
- 在关于滑动窗口的页面上,我发现了一些例子,到目前为止,你只能为"partitionby"选择字段
窗户W1组件(按ticker_symbol分隔范围间隔"1"分钟之前);
请不要认为这是仇恨的帖子,我经常使用AWS,大多数服务都是可靠和用户友好的。这更多的是一种尝试,指向更多用户(不仅仅是我)可能需要的一些功能。
或者,如果你知道这是如何在Kinesis Analytics中使用的,那就很有意思了,因为我在文档中没有发现任何关于这些功能的信息。
根据我在他们的文档中阅读的内容
对于基于时间的窗口查询,可以根据时间指定窗口大小(例如,一分钟窗口)。这需要在应用程序内流中有一个单调增加的时间戳列。(新行的时间戳大于或等于前一行。)Amazon Kinesis Data Analytics为每个应用程序流提供了一个名为ROWTIME的时间戳列。指定基于时间的查询时可以使用此列。对于您的应用程序,您可以选择其他时间戳选项。有关更多信息,请参阅时间戳和ROWTIME列。
可以有事件时间窗口,但时间戳必须单调增加,这表明只有简单的水印。在搜索水印时,确实在此页面上找到了一些点击。