Solr标准的英语语言同义词列表



我想要的是,如果我在英语中搜索'vehicle'和其他类似的同义词,包含'car'的结果也会显示出来。

我知道Solr有SynonymFilterFactory,默认为空。但是我很好奇是否有一种标准的方法来规范英语中的所有单词。我应该从同义词库生成synonys .txt吗?

这样做是标准做法还是有更好的方法来处理这个问题?

看看WordNet。这是一个标准的英语同义词典包。它包含在Python的NLTK包中,编写一个脚本以SynonymFilterFactory所需的格式转储它应该不需要做很多工作。

但是@jay的观点是,你会得到很多你可能不想要的点击量。花一些时间来定制你的词库到你的领域将支付股息!

最新更新