DRUID.io vs Esper CEP



最近几天我读了一些关于德鲁伊的文章,想知道这与埃斯珀有什么不同。我一直在使用Esper进行实时事件处理。感觉Druid通过其简单的类似JSON的查询和简单得多的接口做到了这一点。

有人能纠正我并分享更多的光吗?

编辑
两者能共存吗?

我不认识德鲁伊,可以根据我在网站上看到的内容发表评论。在存储解决方案领域,Druid似乎将自己与Impala、Redshift、Vertica、Cassandra和Hadoop进行了比较。这似乎是一个针对时间序列优化的存储查询,"主键"是时间对象。

Esper不存储数据,而是在数据到达时进行分析,因此可能会实现更低的延迟和更高的吞吐量,因为它永远不会进入磁盘(除非具有高可用性)。德鲁伊似乎能够分析存储的时间序列数据,而这需要从另一个存储到埃斯珀的事件回放。

Druid集群由不同类型的节点组成,因此,虽然有些节点是"先存储后查询",但也有所谓的"实时"节点。来自Druid文档:

实时节点提供实时索引。通过这些节点索引的数据可立即用于查询。实时节点将定期构建表示他们在一段时间内收集的数据的分段,并将这些分段转移到历史节点。

Druid文档和博客中有关于如何流式传输数据并立即查询数据的示例。因此,从这个意义上讲,它可以做与Esper类似的事情,但也可以将数据存储在历史节点中,以供以后查询。它还可以通过Hadoop获取数据(显然不是实时处理),这意味着流式数据可以在更正或丢失数据时进行修改。

最新更新