我有一个需要部署PRESTO服务器,该服务器可以帮助我查询以AVRO文件格式中存储在ADL中的数据。我已经完成了本教程,看来Hive被用作Presto中的目录/连接器来查询ADLS。我可以绕过Hive并有任何连接器来从ADL中提取数据?
我可以绕过Hive并有任何连接器以从ADL中提取数据?
否。
Hive在这里扮演两个角色:
- 元数据存储。它包含以下信息:
- 模式和表名称
- 列
- 数据格式
- 数据位置
- 执行
- 它能够从(HDFS)分布式文件系统(例如HDFS,S3,ADL)读取数据
- 它讲述了如何分发执行。