全文个性化搜索产品



什么样的全文搜索技术可以支持全文个性化搜索?

例如,在你选择的webmail提供商中的联系人搜索:它是全文,但只搜索你的个人联系人,而不是整个联系范围。

有无数的全文搜索包,但我不知道如何使用大多数全文搜索包,使每个用户只能看到文档的一小部分。

对于电子邮件,很简单:使用任何流行的搜索工具包并为每个用户构建索引。这很简单,因为索引不应该重叠,否则就会侵犯用户的隐私。此外,重叠可能会扭曲IDF等数据。(您可能想要对发送给多个用户的电子邮件只索引一次,但这样做的安全和隐私影响是不值得的。磁盘很便宜

如果一个通用的文档集合应该为个性化搜索建立索引,恐怕你得靠自己了。

我建议用contact_list_id, usage_frequency等特殊字段建立所有联系人的lucene索引。在搜索每个用户时,添加他们的特定参数,即text:"John smith"AND contact_list_id:"$current_user_id"order by usege_frequency。在这种情况下,您将优化索引所有压缩在一个地方的数据,它也个性化的字段,如usage_frequency或更健壮的秩。

最新更新