索尔多语言搜索



>我目前正在做一个项目,我们在 SOLR 中索引了文本内容。每个内容都用一种特定的语言编写(我们有 4 种不同的 欧洲语言(,但我们想添加一个功能,如果主要搜索(用户输入的搜索文本(没有返回太多结果,那么我们也尝试查找其他语言的文档。因此,我们需要以某种方式翻译查询。我们的基础是,我们可以有一个项目领域常用的翻译单词的映射列表。

我遇到的一个解决方案是使用同义词搜索功能。但这可能无法提供最佳结果。

人们是否有关于现有模块的指针可以帮助我们实现此多语言搜索功能?还是我们冷酷地试图调查的概念?

谢谢

多语言搜索似乎不是一个独特的问题。

请看一看http://lucene.472066.n3.nabble.com/Multilingual-Search-td484201.html和Solr索引和搜索多语言数据

这两个链接建议为每种语言设置专用字段,但您也可以有一个声明语言的字段,并且可以为检测到的语言添加筛选器查询 (&fq=((来自用户查询(。我认为这是更具可扩展性的解决方案。

一种选择是在索引时翻译您的术语,这可能在 Solr 级别完成,甚至在应用程序级别的 Solr 之前完成,然后将翻译的文本存储在不同的字段中,这样您就可以拥有以下字段:

text_en: "Hello",
text_fi: "Hei"

然后你可以查询text_en:Hello,它会匹配。

如果您想对主要语言匹配项进行更高的评分,则可以设置一个primary_language字段,然后在与搜索语言匹配的地方提升文档。

最新更新