Impala 并发查询延迟

我的集群配置如下：

3 节点群集
每个群集节点 128GB 内存。
处理器：每个群集节点 16 个核心超线程。所有 3 个节点都有 Kudu master 和 T-Server 和 Impala 服务器，其中一个节点有 Impala 目录和 Impala StateStore。

我的问题如下：

1( 在运行并发查询时，我很难弄清楚 Impala 中的动态资源池。我试过给mem_limit仍然没有运气。我也尝试过静态服务池，但我也无法实现所需的并发性。即使使用准入控制，也无法实现所需的并发性。

I) The time taken for 1 query: 500-800ms.
II) But if 10 concurrent queries are given the time taken grows to 3-6s per query.
III) But if more than 20 concurrent queries are given the time taken is exceeding 10s per query.

2(我的一个集群节点在提交查询后没有承担负载，我通过查询摘要检查了这一点。我尝试在没有承担负载的节点上将NUM_NODES为 0 和 1，但摘要显示节点没有承担负载。

表格大小是多少？表中有多少行？表是否分区？如果您可以将您的配置与 Impala 基准测试进行比较，那就太好了

如上所述，Impala 旨在运行在大规模并行处理基础设施上。如果我们设置了 10 个节点(80 个核心(和 160 个虚拟核心(12 TB SAN 存储(，那么对于 5 个并发用户，我们可以获得 60 秒的计算时间。

相关内容

最新更新

热门标签：