我正在尝试获取freebase的子集。对于几种类型,我主要想要最流行的实体。例如,当我试图获取最受欢迎的电影时,我想要前2k最受欢迎的电影。我发现这里没有人气排名,但每当我尝试用预估预算或总收入之类的东西来限制/排序时,我都会得到一个非常小的结果集。有没有什么方法来评估哪些字段可能是真正相关的,而不仅仅是一个在非常低的结果百分比中使用的字段?
一个简单的电影查询示例:
[{
"type": "/film/film",
"limit": 10,
"name": null,
"id": null
}]
问题是我应该考虑哪个"sort"
选项,使其通过某种流行启发式排序?
查看此页:
http://wiki.freebase.com/wiki/Search_Cookbook Scoring_and_Ranking
上面写着:
Freebase实体在索引期间有一个固有的相关性评分(排名),这是它在Freebase和Wikipedia中的入站和出站链接计数的函数
您还可以添加其他约束或分数,如前页所述。
"相关性分数"仅在创建图时可用,在使用图时不可用。相反,正如链接中提到的"结果总是按最终分数排序,最高分数第一"。而分数是几个分数的组合,你可以选择分数的类型,例如得分:freebase等