Hive可以在任何存储系统上工作还是需要HDFS本身?



Hive始终与HDFS相耦合。我的问题是,Hive可以运行在HDFS以外的任何其他位置吗?就像spark一样,它是否支持任何数据存储?

Hive是为hadoop构建的,因此是为HDFS构建的。以下是官方文档对它的描述

什么是Hive

Hive是基于Apache Hadoop的数据仓库基础设施。Hadoop为商用硬件上的数据存储和处理提供了大规模的扩展和容错能力。

然而,根据维基百科,Hive可以"兼容";文件系统:

Apache Hive支持分析存储在Hadoop HDFS和兼容的文件系统(如Amazon S3文件系统和Alluxio)中的大型数据集。

我敢说,Hive的官方文档中没有关于这个的文档,但是你可以在AWS和Alluxio的网站上找到很多。