Geomesa-受支持的数据存储之间的差异



我正在浏览Geomesa的文档,并且目录表明可以使用的许多支持的数据存储:

特定的后端实现在以下 章节:

    Accumulo Data Store
    Kafka Data Store
    HBase Data Store
    Bigtable Data Store
    Cassandra Data Store

虽然Accumulo和Kafka数据存储文档具有很多内容,但HBase,Bigtable和Cassandra并非如此。它没有列出缺少的功能,注释数据存储是否适用于生产。

我找不到这些数据存储的实现级别(如支持/缺失功能,稳定性等)的比较。

我的问题:

  1. 当使用Accumulo上班时,我会有什么好处,例如Cassandra作为Geomesa的数据存储?
  2. 所有数据存储都在相同的实现级别上吗?

很棒的问题;这只是最近出现在Geomesa用户列表上。

在高水平上,所有Geomesa实现都是GeoTools Datastores,共享类似的命令行工具,并与GeoServer集成。如果您只需要这样的一般访问,则任何数据存储都应该很好。

Geomesa的Accumulo支持率是最长的,因此还有其他功能,例如向数据库服务器推出统计数据计算和热图生成。Accumulo和HBase足够相似,应该直接将这些功能移至HBase,并且该工作正在进行中(这正在发生在Geomesa 1.3.x线中)。

Accumulo,HBase(因此Google Cloud Bigtable)数据存储支持Spark/Spark SQL。(从Geomesa版本1.3.1开始。)

对于C*,也有积极部署可以达到特征奇偶校验。据我所见,C*并不能使添加服务器端查询处理变得非常容易(Accumulo Iterator很棒; HBASE过滤器和综合处理器也很棒)。

KAFKA数据存储用于流数据。如果您的应用程序具有流式地理数据,并且您想对其进行近乎真实的时间视图和/或处理" Live",那么Kafka适合您。其他数据存储用于长期持久性,查询和批处理分析。

最新更新