有人在Cassandra数据库中使用商业智能吗



我们将时间序列操作数据存储在Cassandra中。目前Cassandra表为用户界面提供了强大的功能,并且运行良好。插入约30万条/分钟记录,保留期为2个月。我们希望使用像Apache Superset这样的商业智能(BI(工具来连接数据库,以便可以创建报告/仪表板。技术堆栈中没有Apache Spark或Presto。

BI工具喜欢说SQL。在Cassandra中,您需要提前了解查询以设计模式。您需要以各种组合方式复制数据。作为一个noSQL数据库,它看起来不适合BI工具提供的特殊分析。

  • 您是否将Cassandra用于此类用例以及如何使用
  • 如果有的话,还有什么选择

Apache Superset需要一个SQLAlchemy驱动程序来处理像Cassandra这样的数据库。一般来说,我建议想要查询NoSQL数据库的Superset爱好者使用中间查询引擎,如Presto、Trino或Drill

  • https://trino.io/docs/current/connector/cassandra.html
  • https://preset.io/blog/2021-6-22-trino-superset/

仅限于此处列出的Cassandra用例https://dzone.com/articles/an-introduction-to-apache-cassandra.

缺少联接和子查询等会使事情变得困难。

建议卸载到AWS Timestream、Snowflake、Kudu等。

最新更新