我有一组来自Facebook的兴趣和喜欢数据,我有兴趣用其他来源的数据来丰富,即Freebase。 有没有办法确定Freebase中的哪个条目对Facebook Graph中的给定条目做出响应?
首先,Facebook Graph不提供任何指向外部资源的链接,因此似乎需要在外部资源中找到任何类型的关系。我发现,至少对于某些条目,Freebase提供了一个"Facebook URL",因此你可以以一种迂回的方式将两者联系起来。 例如,对于乐队"夺回星期天",这里是Facebook Graph URL:
https://graph.facebook.com/23854511408
。或者可以使用虚 URL:
https://graph.facebook.com/TakingBackSunday
现在在Freebase中,如果我以RDF格式(http://rdf.freebase.com/rdf/en.taking_back_sunday(或JSON格式查看"夺回星期日"条目,我可以看到指向Facebook虚荣URL的链接。 假设这个属性可以被MQL查询,那么通过这种方法将Freebase链接到Facebook Graph是可能的。 然而,问题是Freebase中的许多条目都没有Facebook的链接。
关于是否有一致的方式来发现这些联系的任何想法?
- 从您的兴趣和喜欢列表中创建一个电子表格,其中包含名称和FB图形URI列。
- 将电子表格加载到谷歌精炼中。
- 将名称列与 Freebase 进行协调。
-
使用以下 GREL 代码基于协调的名称列为 Freebase URI 创建新列:
"http://rdf.freebase.com/ns/" + cell.recon.match.id[1,-1].replace("/", "."(
-
将扩充数据导出到新的电子表格。
如果你能把Facebook的图形数据变成RDF格式,并且你有兴趣在数据集中连接特定类型的实体(例如,波段(,那么你可以使用像Silk这样的链接发现工具。你写一个映射,告诉Silk如何比较名称,流派,家乡等,Silk将计算连接。不过,这需要相当多的努力。
另一种选择可能是使用Google Refine,它具有"协调"功能,可以发现与您的数据匹配的Freebase实体。挑战再次是如何将Facebook数据导入Google Refine。