MongoDB文本索引不支持的语言



我有一个存储在mongodb数据库中的大型希腊Tweets数据库。

(3M Tweets大约30GB的存储空间)。

我在文本上创建了一个文本索引,在时间戳字段上创建了一个有序索引。然而,我发现MongoDB不支持希腊语文本索引,因此希腊语文本查询相对较慢。我如何面对这个问题,并为希腊文档创建一个倒排索引?

使用solr而不是mongodb来构建索引,它有很多支持多语言搜索的功能。

我刚刚发现,如果我根据文档选择语言none,将创建一个使用标记化的简单倒排索引。

http://docs.mongodb.org/manual/reference/text-search-languages/text-search-languages

如果指定语言值为"none",则文本搜索使用简单的标记化,没有停止词列表和词干提取

最新更新