为什么形容词的词性标签为"JJ"?

  • 本文关键字:JJ 标签 形容词 词性 nlp
  • 更新时间 :
  • 英文 :


JJ标签的词源是什么,表示形容词的POS? 我无法在网上找到任何参考资料。有几个资源列出了所有标记,但没有一个描述原因。

可能无法得到官方答案。JJ布朗语料库以来一直被使用,并且至少在1981年(就在1979年表格C"修订和放大"版出版之后)的出版物中没有评论。

根据语料库的记录,作者在表格C中的主要出版物是手册,可在此处获得。它包含列表,其中有大量关于单词如何分类的解释,而没有关于标签是如何制作的。

在回顾了布朗语料库在语料库语言学史中的作用(Olga Kholkovskaia,2017)之后,我同意作者通常专注于大量的编译和标记方法而不是评论。1967年的经典"当代美式英语的计算分析"主要是频率表,其中没有"形容词"或JJ的实例。因此,我没有发现主要作者Wilson和Kucera讨论他们选择标签的出版物,并且都在2000年代去世。

这限制了我们的猜测。作者有82个标签,这些标签需要简短,令人难忘(标记过程部分是手动的),并允许附加各种修饰符而不会造成混淆。元音对此相当无用,表中的每个词性都至少包含一个。动词(VB)和名词(NN)是首字母和最后一个字母,而其他人可以使用首字母缩写(协调连CC,外来词FW),音节首字母缩写(情态MD,预确定PDT),第一个字母(所有格POS),任意联想(感叹词UH)。

形容词的JJ使用短语中没有的字母很奇怪,并且不像UH、所有格P$或复数S那样具有直观的意义 - 但即使在缩小的Penn Treebank表中,也几乎不是最奇怪的标签选择。也许有人想配合NN的风格,把形容词中第一个相对不常见的字母加倍。任何更详细的答案可能只有通过找到未发表的笔记或仍然活着的同事才能实现。

最新更新