我们希望在 RHEL 机器上构建 presto 生产集群
其中一台机器是Presto协调员,其他所有机器都是Presto工人
生产环境最小的presto工人有什么建议?
有关Presto的更多详细信息:
Presto 协调器是负责解析语句、规划查询和管理 Presto 工作节点的服务器。它是 Presto 安装的"大脑",也是客户端连接到以提交语句执行的节点。每个 Presto 安装都必须有一个 Presto 协调员和一名或多名 Presto 工作人员。出于开发或测试目的,可以将Presto的单个实例配置为执行这两个角色。
协调器跟踪每个工作人员的活动并协调查询的执行。协调器创建涉及一系列阶段的查询逻辑模型,然后将其转换为在 Presto 工作线程集群上运行的一系列连接任务。
协调器使用 REST API 与辅助角色和客户端通信。
工人 Presto worker 是 Presto 安装中的服务器,负责执行任务和处理数据。工作器节点从连接器获取数据并相互交换中间数据。协调员负责从工作人员那里获取结果并将最终结果返回给客户端。
当 Presto 工作进程启动时,它会将自身通告到协调器中的发现服务器,从而使 Presto 协调器可用于执行任务。
工作人员使用 REST API 与其他工作人员和 Presto 协调员进行通信。
最小数量的 Presto 工作线程在您的环境类型上独立1
。 您可以将 Presto 协调器节点配置为运行工作线程,并获得最小的单节点设置来评估功能。根据官方指南,您可以通过在config.properties
中指定以下参数来做到这一点:
coordinator=true
node-scheduler.include-coordinator=true
如果没有其他信息,如预期的用户数量、数据集的数量和大小、基础设施性能等,就不可能确定工人的最低合理生产量。