雅典娜是否有一组巨大的机器可以从用户那里获取查询并与他们的数据相反?他们是否使用特定的开源群集管理软件为此?
我相信AWS永远不会透露他们如何运营雅典娜服务。但是,由于雅典娜被管理PrestodB,因此可以根据此来推论整体设计。
prestodb不需要诸如Yarn,Messos之类的群集管理器。它拥有自己的计划者和调度程序,可以在工作节点上运行SQL物理计划。
我假设每个可用性区域内的AWS维护了连接到数据目录(AWS胶(和一组Presto Worker的PRESTODB协调器。工人是弹性和自动化的。在不活动的情况下,它们会降低,但是当活动爆发时,新工人添加到集群中。