我想用Spacy标记名词的性别;特别是在我的情况下,德国人。
我不确定哪个Spacy管道有关于名词性别的信息,例如Tagger或Lemmatizer?
不同的语言有不同的语法特征,因此您可以查看语言的特定语言模型来确定它有哪些管道。
对于德语,我们可以在"标签方案"下看到,"形态学家"管道上有包括"性别"在内的标签。
在这里,它显示形态学家为每个令牌分配属性"变形"。
"morph"分别属于"MorphAnalysis"类型。
有不同的方法可以从MorphAnalysis对象访问形态注释。
最简单的方法是使用".get"方法,通过传递所需类别的名称:
Token.morph.get(“gender”)
在该类别具有多个值的情况下返回字符串列表。
还可以将MorphAnalysis作为带有to_dict()
的字典返回,作为带有str(Token.morph)
的字符串返回,或者使用循环迭代Token.morph
,循环将每个属性值对作为字符串返回。