DSE Hive 对于 sum() 和 count(*) 等聚合函数的常量时间为 30 秒.映射和减少占用太多时间的作业



最近我在系统上为一个项目配置了dse。现在我想使用 Hive 从 cassandra 获取数据。一切都很好。选择 * 查询只花了不到 1 秒。但问题是,对于使用聚合函数的查询,它需要大约 30 秒的恒定时间(我的意思是每当启动 map reduce 作业时)。我根据datastax文档编辑了mapred-site.xml(也称为dse-mapred-default.xml :D)来调整Hive性能。但不幸的是没有变化。请帮助我

Hive 不是为了更快的查询处理。它是一个数据仓库系统,当您想要批量处理大量数据时,它是首选。

如果你需要更快的结果,我建议你试试hbase/cassandra。

最新更新