Cassandra和apache火花数据库设计,实现日期过滤



在我的应用程序中,所有实时数据存储在Cassandra表中,我计划使用apache spark对其进行分析并将其放入不同的表中,以便更快地获取数据,我想知道我需要应用哪种设计方法。

在一个时间范围内分析相关时间表,然后放入每小时,然后分析到每天,然后每周等,然后很容易实现日期范围内的数据。我的逻辑是好的还是卡桑德拉和火花的任何其他方法?

我认为你的方法很好。它类似于Nathan Marz设计的Lambda架构。有关详细信息,请点击此链接。希望这对您有所帮助。

最新更新