带有Azure Data Lake的Presto查询引擎



我有一个需要部署PRESTO服务器,该服务器可以帮助我查询以AVRO文件格式中存储在ADL中的数据。我已经完成了本教程,看来Hive被用作Presto中的目录/连接器来查询ADLS。我可以绕过Hive并有任何连接器来从ADL中提取数据?

我可以绕过Hive并有任何连接器以从ADL中提取数据?

否。

Hive在这里扮演两个角色:

  • 元数据存储。它包含以下信息:
    • 模式和表名称
    • 数据格式
    • 数据位置
  • 执行
    • 它能够从(HDFS)分布式文件系统(例如HDFS,S3,ADL)读取数据
    • 它讲述了如何分发执行。

相关内容

  • 没有找到相关文章

最新更新