我把我的数据组织在多个图表中。保存三元组的图表很重要。数据结构很复杂,但可以这样简化:
我的商店包含蛋糕,其中有不同蛋糕类型的层次结构,所有子类<cake>
<http://example.com/a1> a <http://example.com/applecake>
<http://example.com/a2> a <http://example.com/rainbowcake>
...
根据用户在 UI 中创建它们的方式,它们最终会出现在不同的图形中。例如,如果用户"烘烤"蛋糕,它就会进入<http://example.com/homemade>
图,如果他们"购买"蛋糕,它就会进入<http://example.com/shopbought>
图。
当我从商店取回我的蛋糕时,我想知道每个蛋糕是自制的还是购物的。这没有任何属性,我想纯粹根据三元组存储的图形检索信息。
我尝试了各种方法来实现这一点,但没有一种在耶拿TDB有效。问题是所有的蛋糕都是"买来的"。然而,所有查询都在 Fuseki 中工作(在确切的 sae 数据集上),我想知道这是否是 TDB 错误或是否有另一种方法。以下是简化的查询(无变化):
版本1:
SELECT DISTINCT *
FROM <http://example.com/homemade>
FROM <http://example.com/shopbought>
FROM NAMED <http://example.com/homemade>
FROM NAMED <http://example.com/shopbought>
WHERE {
?cake rdf:type ?caketype .
?caketype rdfs:subClassOf* <cake>
{
GRAPH <http://example.com/homemade> { ?cake rdf:type ?typeHomemade }
} UNION {
GRAPH <http://example.com/shopbought> { ?cake rdf:type ?typeShopbought }
}
BIND(str(if(bound(?typeHomemade), true, false)) AS ?homemade)
}
版本2:
SELECT DISTINCT *
FROM <http://example.com/homemade>
FROM <http://example.com/shopbought>
FROM NAMED <http://example.com/homemade>
FROM NAMED <http://example.com/shopbought>
WHERE {
?cake rdf:type ?caketype .
?caketype rdfs:subClassOf* <cake>
GRAPH ?g {
?cake rdf:type ?caketype .
}
BIND(STR(IF(?g=<http://example.com/homemade>, true, false)) AS ?homemade)
}
知道为什么这在 Fuseki 中有效但在 TDB 中不起作用吗?
编辑:我开始认为它与GRAPH关键字有关。以下是一些更简单的查询(适用于 Fuseki 和 tdbquery)以及我使用 Jena API 获得的结果:
SELECT * WHERE { GRAPH <http://example.com/homemade> { ?s ?p ?o }}
0 结果
SELECT * WHERE { GRAPH ?g { ?s ?p ?o }}
0 结果
SELECT * FROM <http://example.com/homemade> WHERE { ?s ?p ?o }
x 结果
SELECT * FROM <http://example.com/homemade> WHERE { GRAPH <http://example.com/homemade> { ?s ?p ?o }}
0 结果
SELECT * FROM NAMED <http://example.com/homemade> WHERE { GRAPH <http://example.com/homemade> { ?s ?p ?o }}
0 结果
好的,所以我的解决方案实际上与我执行查询的方式有关。我最初的想法是预先过滤数据集,以便仅在相关图上执行查询(数据集包含许多图,它们可能非常大,这将使查询"一切"变慢)。这可以将它们添加到SPARQL或直接在耶拿完成(尽管这不适用于其他三重商店)。然而,将这两种方式结合起来"为了安全起见"是行不通的。
此查询在整个数据集上运行,并按预期工作:
Query query = QueryFactory.create("SELECT * WHERE { GRAPH ?g { ?s ?p ?o } }", Syntax.syntaxARQ);
QueryExecution qexec = QueryExecutionFactory.create(query, dataset);
ResultSet result = qexec.execSelect();
相同的查询只能在特定的图形上执行,其中哪个图形无关紧要,它不会给出任何结果:
//run only on one graph
Model target = dataset.getNamedModel("http://example.com/homemade");
//OR run on the union of all graphs
Model target = dataset.getNamedModel("urn:x-arq:UnionGraph");
//OR run on a union of specific graphs
Model target = ModelFactory.createUnion(dataset.getNamedModel("http://example.com/shopbought"), dataset.getNamedModel("http://example.com/homemade"), ...);
[...]
QueryExecution qexec = QueryExecutionFactory.create(query, target);
[...]
我的解决方法是现在始终查询整个数据集(它支持 SPARQL GRAPH 关键字 fine),并且对于每个查询始终指定它应该运行的图形,以避免必须查询整个数据集。 不确定这是否是耶拿 API 的预期行为