sparqlregex比较两个字符串变量(一个由另一个组成)



我正在尝试比较两个字符串变量,以发现其中一个是否包含在另一个中,特别是其中一个是由另一个组成的(因此,我希望避免检索到"信息"包含"格式"。我只对类似于"information_management"包含"信息"的结果感兴趣。

我尝试过FILTER CONTAINS()和FILTER regex(),结果都相同。如何修改查询,使其包含术语之前或之后需要有空格的事实?

SELECT DISTINCT ?l1 ?l2
WHERE
{
?term1 skos:prefLabel ?l1.
?term2 skos:prefLabel ?l2.
FILTER(contains(?l1,?l2))
}

如果我理解正确,你想找到一对术语,其中一个术语包含在另一个中,但不等于另一个?

如果是这样,您可以将!SAMETERM()调用添加到FILTER子句中,如下所示:

SELECT DISTINCT ?l1 ?l2
WHERE
{
  ?term1 skos:prefLabel ?l1.
  ?term2 skos:prefLabel ?l2.
  FILTER(!SAMETERM(?l1, ?l2) && contains(?l1,?l2))
}

编辑

重读这个问题,我不认为我解决了整个问题,对于你有"格式"one_answers"信息"这两个术语,但不希望它们匹配的问题,你可以做如下操作:

SELECT DISTINCT ?l1 ?l2
WHERE
{
  ?term1 skos:prefLabel ?l1.
  ?term2 skos:prefLabel ?l2.
  FILTER(!SAMETERM(?l1, ?l2)
         && contains(?l1,?l2) 
         && ( STRENDS(STRBEFORE(?l1, ?l2)," ") 
              || STRSTARTS(STRAFTER(?l1, ?l2), " ")
            ))
}

这要求包含项之前/之后的字符串必须以空格结尾/开头。你可能不得不玩这个游戏,以获得更紧密地模拟你的约束的东西。

另一个解决方案是动态构建正则表达式模式,如:

FILTER(regex(concat("\b", ?l1, "\b"), ?l2))

我不完全确定SPARQL/XML Schema是否需要\b,但我认为大多数实现都会有。

最新更新