有人可以提供分配给创建的_tagged
列的 Pos Tagger 标签列表吗? 我们需要知道所有可以分配的值以及每个值的含义。 例如:En_NN = noun
、En_NNS = plural noun
等。
同样适用于_chunked
列(NP、VP、PP 等(
同样适用于_low_chunked
/_top_chunked
列(Np,Vp,Jp,Rp等(
_parsed - 解析器的结果。每个标记由空格分隔,句子由空行分隔。
_tagged - 后置的结果。在每个标记之后通过斜杠作为其标签。标签的含义:
常见
规格 | 任何特殊符号
标点符号 | 任何标点符号
粒子
En_NEG | 否定器(非(
En_TO | 不定式到
En_AT | 文章
En_OF | 介词 (在 at(
En_CC | 联合协调(和或(
En_CS | 连词从属(即(
En_UH | 感叹词(哎呀(
数字
En_CD | 红衣主教 (一(
En_OD | 序数(第一(
名词
En_NN | 单数主格(猫(
En_NNS | 复数主格(猫(
En_NN$ | 单数属格(猫的(
En_NNS$ | 复数属格(猫的(
形容词
En_JJ | 正(暖(
En_JJR | 比较(温暖(
En_JJT | 最高级(最温暖(
副词
En_RB | 正(便宜(
En_RBR | 比较(更便宜(
En_RBT | 最高级(最便宜(
动词
En_MD | 模态(可能(
En_VB | 不是第三个或复数 (go(
En_VBZ | 第三单数 (goes(
En_VBD | 过去时态(去(
En_VBN | 过去分词(消失(
En_VBG | 现在分词(去(
代词
En_PP | 主格(它他她你我们(
En_PP$ | 占有欲(我们的他的他们的我的你的(
En_PPO | 控诉(他们 他 我 我们 你(
En_PPL | 反身(自己自己(
_chunked、_low_chunked_top_chunked - 是不同级别的分块算法。top_chunked - 最上面的短语,它被构造为小的基本块的联合。
POS 标记器分块机标签是: Np - 名词短语 Vp - 动词短语 Jp - 形容词短语 Rp - 副词短语 Pp - 介词短语 Sp - 连词短语