hadoop弹性搜索



目前在我的组织中,我们在弹性搜索中保存半结构化数据,我们使用查询进行快速文本搜索和聚合,但我们有其他产品位于其他数据库中,因此我们希望将所有数据放在数据湖中,如HDFS

所以如果我使用HDFS作为保存原始数据的数据湖,如何使用弹性搜索?我的意思是弹性搜索在使用之前索引数据,那么是否可以将数据保存在数据湖中,然后弹性搜索直接从数据湖中查询数据,而不需要将数据存储在弹性中?还是将数据保存在数据湖中然后处理,然后再次存储在elastic中,以便索引?

总结一下,我想了解一下elastic和hadoop集成的概念

Spark和Hive都提供Elasticsearch连接器;不需要将文档导出到HDFS,除了可能的备份功能。

https://www.elastic.co/guide/en/elasticsearch/hadoop/current/reference.html

相关内容

  • 没有找到相关文章

最新更新