如何在Solr上使用MoreLikeThis函数来查找与文本文件相似的文档



我试图使用solr做以下事情:

从文本文件中读取一些文本,并在文本上使用MoreLikeThis来查找与该文本相似的文档。我如何用Solr做到这一点?

从我所知道的到目前为止,我认为我必须使用内容流,但我不知道如何配置它…

如果您要从存储在索引中的文档中形成一个MoreLikeThisQuery,那么它将通过从索引中检索TermVector信息来形成查询。

由于您愿意查找与您拥有的文本文件相似的文档,因此您必须迭代文本文件并使用文本文件中的术语以您想要匹配的方式形成布尔查询。

以上对于Lucene来说是正确的,我相信对于Solr来说也是一样的,考虑到MoreLikeThisQuery是基于TermVector信息的

最新更新