Python中的兴趣爱好语义搜索+最新消息



我想在一组关键词(主要是人们可能感兴趣的爱好、最新消息等)上实现基于python的语义搜索。我想知道是否存在相同的本体数据库和相同的开源搜索算法/实现。

例如。我的套装={聊天、喝酒、发推特、卡特琳娜·凯夫、卡特琳娜飓风、岩石收集、硬币收集}

所以,在搜索"累积"时,我可能会得到岩石收藏和硬币收藏作为输出。

编辑:术语可以有多个单词。这就是"美国总统巴拉克·奥巴马"的疑问。

您可能想要使用"随机索引"。它可以做你需要的事情,它为每个单词计算一个特征向量,并定义两个单词之间语义相似性的度量。

你只需要拿一本《随机索引导论》和一个语义向量包就可以开始了。。。

我希望这能有所帮助,如果你需要进一步的建议,请评论。。。

我希望但不确定这是否对您有帮助。

Gnowsys

  • 仍在大力开发中

最新更新