什么是默认的 nltk 词性标签集



在尝试NLTK词性标记时,我注意到调用nltk.pos_tag的输出中有很多VBP标签。 我注意到这个标签不在布朗语料库的词性标签集中。 然而,它是宾夕法尼亚大学标签集的一部分。

nltk 默认使用什么标签集? 我在官方文档或 apidocs 中找不到这个。

Ntlk 使用 PennTreebank 标签集。看看这个链接 http://nltk.org/api/nltk.tag.html

它使用Penn Treebank项目中使用的POS标签。您可以看到具有含义的标签列表"http://www.ling.upenn.edu/courses/Fall_2003/ling001/penn_treebank_pos.html"

NLTK使用Penn Treebank标签集作为默认值。其他可用。此处列出了作为 NLTK 库一部分提供的其他标记器(以及其他标记集)。

最新更新