我正在分析一个具有特定品牌名称的数据集。与其从头开始训练POS
,有没有一种方法可以将该品牌的POS值提供为PROPN
?所以它总是被当作CCD_ 3处理。
不完全是。您可以将您的文档后处理以将单个代币的POS更正为PROPN
,但周围代币的POS注释不会受到影响。tagger不支持提供部分注释作为起点,因此没有办法通过提前提供来影响tagger。
要更正单个代币的POS,您可以使用attribute_ruler
组件,也可以编写自己的小型自定义组件。
请注意,解析器和NER组件不使用POS标记作为特性,因此即使您修改了POS,它们的分析也不会改变。