在gitlab中对RDF存储进行版本化的可能方法



在gitlab中对RDF存储进行版本化的可能方法是什么?

正如@UniformedUser已经提到的,QuitStore就是本着这种动机开发的。它对SparqlUpdate请求生成提交,还仅对数据执行操作。为了表示存储库中的数据,它维护数据的规范表示。这种表示允许查看数据的diff,也可以很好地使用git的包文件来减少空间。

维护三元组的稳定表示的一个好的开始是使用N-triples序列化,对三元组进行排序并使其唯一。这可以在更新作业或orkg转储(update.sh(中看到

LC_ALL=C rapper -i <your input serialization> -o n-triples <your file> | sort -u > dump.nt

使用LC_ALL=C设置区域设置对于在执行环境中保持相同的顺序非常重要。

最新更新