我已经用细粒度的POS标记标记了一堆文档,具体到英语。
我想把这些标签映射成粗粒度的标签,在不同的语言中更通用。
在空间中是否有对应的映射?
例如,将以下所有细粒度标记映射到NOUN
。
"NN": "noun, singular or mass",
"NNP": "noun, proper singular",
"NNPS": "noun, proper plural",
"NNS": "noun, plural",
我知道空格可以用两种类型的标签标记文档,但我不想再重新标记文档。
space已经在使用管道中的AttributeRuler做您在预训练模型中描述的事情了。我建议您查看AttributeRuler文档。