如何使用Amazon Timestream对数据进行采样



我正在进行一个项目,需要使用时间流获取小时数据样本。我一直在使用这个查询:

select *
FROM table_name 
WHERE time >= from_iso8601_timestamp('2022-10-11T11:31:51') 
and time <= from_iso8601_timestamp('2022-10-11T12:31:51') 
order by random(<some large number>)
limit 1000

这给了我一组相当随机的行,但我注意到它查询了整个小时,然后才返回行。由于您为扫描的GB付费,这并不理想。我也尝试过不使用随机函数,只限制查询的大小。尽管它减少了扫描的GB,但结果并不是足够随机。

如何在不运行昂贵查询的情况下获得随机样本?

您似乎在寻找定时查询。https://docs.aws.amazon.com/timestream/latest/developerguide/scheduledqueries.html

最新更新