我正在阅读一篇论文,上面说使用WordNet 3级,因为如果他使用5级将会丢失很多,但我不知道如何使用这些假定的级别。我没有他的密码,所以我不能分享,但我可以分享论文。你们能帮我弄清楚这是否可行,怎么做吗?第16页输入链接描述
"在选择对名词进行分组的概念层次时,我面临着特殊性和覆盖面之间的权衡。例如,如果我在"狗"的概念层面上将类别分组,我就会丢失所有只存在于更一般层面上的单词,如"哺乳动物"one_answers"动物"。附录中的图A3显示了从O. NET任务中提取的动词-名词对的比例,由于这个原因在每个聚合级别上都会丢失。由于表达O. NET任务的通用性水平,例如,如果我在WordNet级别5进行分组,我将失去超过四分之一的动词-名词对。(数字越高的级别越具体。)因此,我使用WordNet级别3作为我的主要结果,并在级别2、4和5上重新运行我的分析以检查它们的敏感性。虽然聚合级别确实会产生一些差异,但这些其他级别的结果在质量上与我的基线规范非常相似。">
我理解这篇论文的方式是,作者选择了一个固定的"深度"级别(或到"实体"的距离),并将所有更具体的概念组合在一起。那么'dog'将处于8级。
在wordnet中,你可以像这样找到这个词和"entity"这个词的词根:
wordnet.synset('dog.n.01').min_depth()
听起来像"level"在WordNet层次结构中。
"狗"的祖先包括"食肉动物"、"哺乳动物"、"脊椎动物"、"动物"one_answers"物理实体"。
"物理entity"是WordNet中的顶层概念;我认为作者把狗放在第5级,所以一定把它算作第0级。(尽管"entity"是"物理实体"的父元素。)
因此,没有显式的"级别号";在WordNet条目中,但是你可以通过向上计算它和树的顶部之间有多少个连词来获得它在层次结构中的级别。
参见WordNet有"级别"吗?(NLP)