在生产系统中。我正在使用两个不同的数据库(卡桑德拉和 MySQL)
我听说过prestoDB,它是一种令人惊讶的工具,因为我们可以制作 Cassandra(大数据库)中的sql查询。现在来分析我有的部分 两个不同的源MySQL和Cassandra,即从源中获取数据并查询到不同的源。是否可以在prestoDB中组合两者。
PS :我在presto的mysql连接器中遇到问题。我走了 通过文档,但它没有多大帮助
是的,presto 是这种查询的完美选择。首先,您需要配置 cassandra 连接器和 mysql 连接器。然后,您可以将 cassandra 和 mysql 中的数据合并到一个 sql 中,如下所示:
SELECT u.country, COUNT(*) AS cnt
FROM cassandra.tutorial.stream s
JOIN mysql.tutorial.user u
ON s.userid = u.userid
GROUP BY u.country
ORDER BY cnt DESC
LIMIT 5;
这是一个如何使用presto在hive和mysql中组合数据的教程,但是在cassandra和mysql中合并数据应该是相似的。
http://getindata.com/blog/tutorials/tutorial-using-presto-to-combine-data-from-hive-and-mysql-in-one-sql-like-query/