Solr admin显示索引数(numDocs)大于我处理的文件数



当我用Solr处理56个文件时,它会说"numDoc:74"。我不知道为什么会存在比处理的文件更多的索引,但我给出的一个解释是,几个处理过的文件的索引太大,所以它们被拆分为多个索引(我对所有处理的文件使用丰富的内容提取)。这只是一个想法,所以我不想一开始就认为这是真的。有人能给出另一种解释或证实这一点吗?

使用Django+Haystack+Solr。

非常感谢

不幸的是,您的术语完全不正确,但故障排除过程应该足够简单。Solr配有管理控制台。通常位于http://[localhost或domain]:8983/solr/。转到那里,在下拉列表中找到您的集合(我假设是Solr 4),并在query屏幕中运行默认查询。这应该会给你所有的文件,你可以看到额外的是什么。

我怀疑您的唯一ID和/或重新索引可能存在一些问题。但是,通过少量的文档,您可以查看Solr中实际存储的内容,找出不正确的地方。

最新更新