我有以下格式的数据
<foo bar> <property abc> <this foo bar> .
现在这个字符串中基本上有4个部分:foo bar
;property abc
;this foo bar
;和CCD_ 4。如何将上面的字符串标记为这四个部分?
正如其他人所建议的那样,如果你想解析RDF图,只需使用像Apache Jena这样的库(免责声明-我是开发人员之一)。
如果你的问题更大,你需要直接控制解析过程,那么有几个选项:
- Jena有一个TokenizerText类,如果你想在文本级别处理数据,它可以标记类似NTriple/Turtle/SPARQL的数据
- 您可以实现StreamRDF接口,并将其与内置的解析器一起使用,以控制在三重/四重级别解析数据时发生的情况
String[] array = string.split("> ");
for (int i = 0; i < array.length -1; i++){
System.out.println(array[i] + ">");
}
System.out.println(array[array.length-1]);