在哪里可以找到已使用 dbpedia 属性概念注释的文本数据的数据集(其范围为 float 或 int)?



我正在做一个项目,试图将DBpedia概念映射到表数据列。具体来说,我想映射文字(数值;浮点,int..)。因此,我需要足够数量的数据来构建背景知识库。我从T2D-golden-dataset中提取一些数据作为本描述末尾的给定格式。实际上,我应该将它们用作测试的基准,它仅包含整个表中不到 20 列。谁能帮我找到这样一个文字价值和dbpedia注释数据集?

文字值的数据库百科范围;

"http://www.w3.org/2001/XMLSchema#float"
"http://www.w3.org/2001/XMLSchema#integer"
"http://www.w3.org/2001/XMLSchema#positiveInteger"
"http://www.w3.org/2001/XMLSchema#integer"

某些属性具有这些范围;

"http://dbpedia.org/ontology/speaker",
"http://dbpedia.org/ontology/ranking",
"http://dbpedia.org/ontology/humanDevelopmentIndex",
"http://dbpedia.org/ontology/numberOfPlatformLevels",
"http://dbpedia.org/ontology/enginePower",
"http://dbpedia.org/ontology/graySubject",
"http://dbpedia.org/ontology/shareOfAudience",
"http://dbpedia.org/ontology/percentageLiteracyWomen",.........

我需要找到或以某种方式生成的示例是与上面给出的概念相对应的数组。举个例子;

"http://dbpedia.org/ontology/enginePower" : ["220", "125", "1300",....],
"http://dbpedia.org/ontology/humanDevelopmentIndex" : ["0.34", "0.78", "0.98", ...]

我不需要那种确切的格式。如果我能找到足够数量的数据表作为dbpediaT2D golden dataset,那就太好了.

此查询将使您开始前进,因为它为您提供 100 个<http://dbpedia.org/ontology/populationTotal>的类型文本值,这些值都键入为<http://www.w3.org/2001/XMLSchema#nonNegativeInteger>--

PREFIX  dbo:  <http://dbpedia.org/ontology/>
SELECT DISTINCT ?value
WHERE 
{ ?subject dbo:populationTotal ?value } 
LIMIT 100

这个相当复杂(且昂贵)的查询会得到一些类似于我认为你想要的最终结果的东西 - 但你需要多次运行它,一次运行几个谓词,才能从公共终结点获取你要求的所有内容。 如果需要,您可以在 AWS 云中启动自己的 DBpedia 镜像实例,并调整 Virtuoso 的超时和其他限制,以便构建和运行一个将交付一个巨大的结果集的查询。

PREFIX  xsd:  <http://www.w3.org/2001/XMLSchema#>
PREFIX  dbo:  <http://dbpedia.org/ontology/>
SELECT # DISTINCT ?predicate ?value ?value_type ?value_str
?predicate ?value_type ( GROUP_CONCAT ( DISTINCT ?value_str ; separator=", " ) AS ?values )
WHERE 
{ ?subject  ?predicate  ?value 
VALUES ( ?predicate ) { ( dbo:numberOfPlatformLevels )
( dbo:shareOfAudience )
( dbo:populationTotal ) 
}
BIND ( DATATYPE ( ?value ) AS ?value_type )
BIND (      STR ( ?value ) AS ?value_str )
} 
GROUP BY ?predicate ?value_type
ORDER BY ?predicate ?value_type
LIMIT 1000

最新更新