从细粒度POS标记到粗粒度标记的映射



我已经用细粒度的POS标记标记了一堆文档,具体到英语。

我想把这些标签映射成粗粒度的标签,在不同的语言中更通用。

在空间中是否有对应的映射?

例如,将以下所有细粒度标记映射到NOUN

"NN": "noun, singular or mass",
"NNP": "noun, proper singular",
"NNPS": "noun, proper plural",
"NNS": "noun, plural",

我知道空格可以用两种类型的标签标记文档,但我不想再重新标记文档。

space已经在使用管道中的AttributeRuler做您在预训练模型中描述的事情了。我建议您查看AttributeRuler文档。

最新更新