在HDFS中查询文本文件(压缩格式)的最佳工具是什么?



我已经将压缩格式的日志文件从数据库导入到HDFS中。我正在使用 Hive CLI 工具查询数据。

您能否分享比 Hive 更好的其他工具来查询数据文件?

注意:我知道可以用来查询的 Spark 框架。但是,我想知道是否有任何其他选项更快或/并提供类似SQL的语法。

提前谢谢。

Impala、Drill、PrestoDB 和 Amazon Redshift 都接受 SQL 语法并提供更好的性能。

有关详细信息,请参阅:

  • https://impala.apache.org/
  • https://drill.apache.org/
  • https://prestodb.io/
  • (仅限 AWS(https://aws.amazon.com/redshift/

最新更新