我已经将压缩格式的日志文件从数据库导入到HDFS中。我正在使用 Hive CLI 工具查询数据。
您能否分享比 Hive 更好的其他工具来查询数据文件?
注意:我知道可以用来查询的 Spark 框架。但是,我想知道是否有任何其他选项更快或/并提供类似SQL的语法。
提前谢谢。
Impala、Drill、PrestoDB 和 Amazon Redshift 都接受 SQL 语法并提供更好的性能。
有关详细信息,请参阅:
- https://impala.apache.org/
- https://drill.apache.org/
- https://prestodb.io/
- (仅限 AWS(https://aws.amazon.com/redshift/