小贝子编程

DSE Hive 对于 sum() 和 count(*) 等聚合函数的常量时间为 30 秒.映射和减少占用太多时间的作业

本文关键字：时间映射作业太多函数 count sum 对于 Hive DSE 常量 cassandra hive delay
更新时间 : 2023-08-31
英文 : DSE Hive taking a constant time of 30 seconds for aggregate functions like sum() and count(*). Map and Reduce Jobs taking too much time

最近我在系统上为一个项目配置了dse。现在我想使用 Hive 从 cassandra 获取数据。一切都很好。选择 * 查询只花了不到 1 秒。但问题是，对于使用聚合函数的查询，它需要大约 30 秒的恒定时间（我的意思是每当启动 map reduce 作业时）。我根据datastax文档编辑了mapred-site.xml（也称为dse-mapred-default.xml :D）来调整Hive性能。但不幸的是没有变化。请帮助我

Hive 不是为了更快的查询处理。它是一个数据仓库系统，当您想要批量处理大量数据时，它是首选。

如果你需要更快的结果，我建议你试试hbase/cassandra。

DSE Hive 对于 sum() 和 count(*) 等聚合函数的常量时间为 30 秒.映射和减少占用太多时间的作业

相关内容

最新更新

热门标签：