Geomesa-受支持的数据存储之间的差异

我正在浏览Geomesa的文档，并且目录表明可以使用的许多支持的数据存储：

特定的后端实现在以下章节：

    Accumulo Data Store
    Kafka Data Store
    HBase Data Store
    Bigtable Data Store
    Cassandra Data Store

虽然Accumulo和Kafka数据存储文档具有很多内容，但HBase，Bigtable和Cassandra并非如此。它没有列出缺少的功能，注释数据存储是否适用于生产。

我找不到这些数据存储的实现级别（如支持/缺失功能，稳定性等）的比较。

我的问题：

很棒的问题；这只是最近出现在Geomesa用户列表上。

在高水平上，所有Geomesa实现都是GeoTools Datastores，共享类似的命令行工具，并与GeoServer集成。如果您只需要这样的一般访问，则任何数据存储都应该很好。

Geomesa的Accumulo支持率是最长的，因此还有其他功能，例如向数据库服务器推出统计数据计算和热图生成。Accumulo和HBase足够相似，应该直接将这些功能移至HBase，并且该工作正在进行中（这正在发生在Geomesa 1.3.x线中）。

Accumulo，HBase（因此Google Cloud Bigtable）数据存储支持Spark/Spark SQL。（从Geomesa版本1.3.1开始。）

对于C*，也有积极部署可以达到特征奇偶校验。据我所见，C*并不能使添加服务器端查询处理变得非常容易（Accumulo Iterator很棒； HBASE过滤器和综合处理器也很棒）。

KAFKA数据存储用于流数据。如果您的应用程序具有流式地理数据，并且您想对其进行近乎真实的时间视图和/或处理" Live"，那么Kafka适合您。其他数据存储用于长期持久性，查询和批处理分析。

相关内容