最近我在系统上为一个项目配置了dse。现在我想使用 Hive 从 cassandra 获取数据。一切都很好。选择 * 查询只花了不到 1 秒。但问题是,对于使用聚合函数的查询,它需要大约 30 秒的恒定时间(我的意思是每当启动 map reduce 作业时)。我根据datastax文档编辑了mapred-site.xml(也称为dse-mapred-default.xml :D)来调整Hive性能。但不幸的是没有变化。请帮助我
Hive 不是为了更快的查询处理。它是一个数据仓库系统,当您想要批量处理大量数据时,它是首选。
如果你需要更快的结果,我建议你试试hbase/cassandra。