从solr导出一系列文档,包括索引数据和存储数据



我有几个solr实例,一个有400万个,另一个有800万个文档,我想把它们分解并转移到一个新的solr环境中。我想导出一系列文档,这样最终我就可以拥有一组实例,每个实例大约有100万个文档。我读过关于简单地复制索引文件的文章,也看过像luke这样的工具,但第一个选项迫使我复制所有内容,而第二个选项提供了范围选项,它只输出我存储的字段,而不是我索引的字段。

有没有任何工具可以让我导出一系列完整的文档,然后导入到另一个solr实例中?

这是将Solr索引拆分为两半的常用方法。我已经做了好几次了,如果有一个逻辑键(如日期范围等)是均匀分布的,那就很容易了。

有一个Lucene索引拆分工具。不过我自己没有用过。

为了"导出",您可以使用CSVResponseWriter将其导出到csv中,稍后您可以在另一个实例中对其进行索引,但它显然不会包括未存储的字段。

但是,如果您希望将索引划分为较小的索引,请查看IndexSplitter,在这个问题中查看更多信息

相关内容