有没有一个Python库可以"理解"SKOS,尤其是altLabel-/pref-Label-Concept?



我想用德语STW经济学同义词库注释几个xml文件。您可以在这里获得RDF/XML、N3和Turtle格式的ZIP-Archives文件(每个约14MB)。

所以我写了一个python脚本,可以删除停顿词、引词法和词性标注。现在我想检查xml文件中的一个名词是否在STW-Ontology中。如果是,我想为以后要做的自动分类做不同的选择:

  • 如果是skos:altLabel Word,将其替换为skos:prefLabel Word
  • 对文本不做任何处理,但在文件末尾添加skos:prefLabels,并计算skos:prefLabel和相关skos:altLabels的出现次数
  • 使用例如skos:broader查找与skos:prefLabel相关的经济部门或商品。

我知道GATE和Apolda,它们能够做到这一点,但它们是基于java的,我想在最后从一个python脚本做一切。

有什么建议吗?

我不知道它是否正是您正在寻找的,但是对于RDF,您有RDFLib。

你可以在这个答案中指向的工具/库中获得更多指导。

希望这能帮到你!:)

相关内容

最新更新