我正在尝试提取Freebase转储中的所有命名实体及其类型。
我看过如何提取特定主题的 Freebase 数据转储但是我没有在 Freebase 转储中获得实际的命名实体。
我正在尝试获取这样的信息,姓名:巴拉克·奥巴马 类型:人名称:纽约 类型:城市等
Freebase的数据库中已经有所有这些实体,但我没有找到任何Freebase API或Google API来列出所有实体及其类型。
你能帮帮我吗?
谢谢
此处介绍了数据转储格式。 自从我写了你引用的答案以来,它发生了一些变化,但基本原理仍然是一样的。
MQLread 和搜索 API 都可用于将 Freebase 主题过滤为特定类型(例如/people/person 类型)。 主题可以有多种类型,但如果你想要的是经典的NER类型,那么首先要做的可能是按所需的类型进行过滤,因为在数千万个主题中,Freebase"只有"大约300万人。
Freebase 包含的信息比名称要多得多,这在 NER 任务中很有用,因此您可能希望退后一步,考虑您可能还想要提取哪些其他属性。