Apache Solr支持ORC文件格式



我在蜂巢中有一堆表,存储为orc。我想在Solrcloud集合中索引他们的数据。

是否有任何支持存储在SOLR中的兽人格式的数据的支持?我已经谷歌搜索了,但什么都没出来。

看起来您想要 solr 从特定的Hive文件格式读取数据。

您可能会以另一种方式查看问题格式(无论是orc,parquet,avro,whthing-甚至HBase数据文件)。

在Lucidworks GitHub储备金中,您会找到一个标有 Hive-Solr 的项目。看看。

我会接受Samson的答案。

无论如何,我对此解决方案不完全满意。实际上,现在我仍然需要创建一个手动声明原始表中所有字段的外部表。在操作方面,它与从原始索引开始的新表(存储的AD TextFile)没有什么不同不是我的情况)。

作为一种自我描述格式,Solr直接从压缩文件中读取字段名称和数据非常好。

最新更新