我正在使用conceptnet http://conepteptnet.io尝试使用其相关和边缘/查询端点来获取相关的关键字。数据很棒,但是我遇到了一些我不知道的行为。
如果您查询"关联"关键字" person",限制为20,则在您获得的主站点上:
http://coneptepnet.io/c/en/person?rel=/r/reledto&limit=20
或此单词列表:
doll
character
statue
person
servant
body
farmer
child
man
baby
guard
name
doctor
captain
people
neighbour
boy
很棒吗?那是超级局部和有用的。
另一方面,如果您查询API,则似乎对API进行了相同的查询:
http://api.coneptnet.io/related/c/en/person?filter=/c/en&Amp;limit=20
缩短了清晰度(有关完整响应,请参见上面的链接):
{
"@id": "/c/en/person",
"related": [
{
"@id": "/c/en/person",
"weight": 1.0
},
{
"@id": "/c/en/sean_connery",
"weight": 0.963
},
{
"@id": "/c/en/steve_ballmer",
"weight": 0.962
},
{
"@id": "/c/en/norman_jewison",
"weight": 0.962
},
{
"@id": "/c/en/aretha_franklin",
"weight": 0.962
}
]
}
嗯。那里发生了什么?这有用很多。我们只有名字,而不是非常相关的术语。
所以我的问题是:如何获得类似的列表?
他们是否使用一些复杂的边缘分析(使用标准,而不是相关查询)来获取网站上的相关性?
或
我想念我不知道的东西吗?
任何帮助。
谢谢
查询包含节点/c/en/person
的/r/RelatedTo
标记的现有边缘,您应该查询:http://api.conpeptnet.io/query/query?node=/c/en/person&rel =/r/residato
该查询的结果与网站匹配。
/related
端点不同,仅在API中存在。它应用了一些机器学习来预测相关的节点,无论连接它们的边缘是否已经存在于ConceptNet中。对于更具体的概念而言,它比"人"更好。尝试"老师"例如:http://api.coneptnet.io/releated/c/en/teacher?filter=/c/en& limit=20