今天我第一次尝试使用SpaCy排列。我使用了波兰语和英语的管道。我写了一个非常简单的代码:
for token in doc:
print(token, token.lemma)
我不明白为什么,但我得到的回报只有"Token, 0"。我想我已经正确加载了语言管道…
token.lemma
访问令牌引理的哈希值(因此为其内部表示的整数)。
token.lemma_
给你的引理是字符串,所以这可能是你想要的。
查看https://spacy.io/api/lemmatizer#assigned-attributes.
String ID 0,无信息返回,为空字符串。这很可能意味着您正在使用的语言模型没有提供引理信息的管道组件。
例如,en_core_web_lg中的lemmatizer
组件在该模型中提供令牌引理。引理通常使用基于规则的Lemmatizer或经过训练的EditTreeLemmatizer组件来设置。你也可以使用其他方法创建自己的组件来设置引理。