如何将数据从mongodb导入到hive



我想知道如何在mapreduce程序的帮助下将数据从Mongodb导入到hive。以前我是在mapreduct程序的支持下将数据从不godb导入到hdfs的,现在我想直接从Mongodb导入数据到hive中。如果有人能分享任何参考文件,我真的很感激。提前谢谢。

您可以尝试Mongo Hadoop连接器。它允许您使用Mongo作为Hive的后端存储(您可以使用Hive查询存储在MongoDB中的数据)。

如果你真的需要将数据导入配置单元,你首先需要创建一个带有mongo集合的(临时)配置单元表,从中导入数据作为后端。然后,您可以使用配置单元CTAS查询将数据导入到另一个配置单元表中。

最新更新