Hive 数据存储在哪里?



我对蜂巢在哪里存储数据有点困惑。

它是将其数据存储在HDFS还是RDBMS中? Hive 元存储是否使用 RDBMS 来存储 Hive 表元数据?

提前感谢!!

Hive数据存储在Hadoop兼容文件系统之一:S3,HDFS或其他兼容文件系统中。

Hive 元数据存储在 RDBMS 中,如 MySQL,请参阅支持的 RDBMS

可以为托管表和外部表指定 S3 或 HDFS 中 Hive 表数据的位置。

托管表和外部表之间的区别在于,托管表中DROP TABLE语句将删除表并删除表的数据。然而,对于外部表DROP TABLE将仅删除表,数据将保持原样,并可用于在其上创建其他表。

请参阅此处的详细信息:创建/删除/截断表

这是您问题的答案。但我建议你阅读蜂巢书籍或阿帕奇蜂巢网站,以便更好地理解。

它是将其数据存储在HDFS中还是RDBMS中?? -HIVE的数据始终存储在HDFS中。对于托管表,默认情况下数据存储在 hive 仓库中,该仓库是 HDFS 中的一个目录。对于HIVE外部表,用户可以在HDFS中的任何位置指定位置。

Hive Meta 存储是否使用 RDBMS来存储 Hive 表元数据 ?? - 是 HIVE 使用 RDBMS 存储元数据。