如果使用Freebase搜索按名称获取任何实体的匹配项,您将获得按相关性分数排序的结果。例如,尝试泰姬陵。
我正在尝试使用 Freebase 数据转储获得类似的结果,因此在我的数据库中,"泰姬陵"相关主题将按相关性排序,即建筑第一,音乐家其次,依此类推。
有什么建议如何在不查询 Freebase 搜索 API 的情况下实现这一点吗?
您链接到的有关相关性分数的 wiki 页面显示:
Freebase 实体在索引期间计算了一个固有的相关性分数(排名),该分数是其在 Freebase 和维基百科中的入站和出站链接计数的函数。一些流行的Freebase实体也有谷歌计算的受欢迎程度分数。默认情况下,这两个分数在查询期间组合在一起。
这应该给你一个很好的主意从哪里开始。 Freebase的入度和出度可以直接从转储中计算,但维基百科的入/出度需要使用维基百科转储(或Freebase的WEX转储)。 "谷歌计算的人气分数"部分显然是你无法复制的。