NLTK 不会对大写单词进行词形还原



我正在尝试将复数单词更改为大写和小写单词混合的字符串中的单数。例如纸板箱,尺寸:19厘米高× 10厘米宽× 30厘米深

我使用NLTK包来这样做,但它只接受小写字符串,我不想小写字符串中的所有单词。任何建议吗?

希望有所帮助:

from nltk.stem import WordNetLemmatizer
lemmatizer = WordNetLemmatizer()
lemma = []
for t in text.split():
if t.isupper():
t = lemmatizer.lemmatize(t.lower())
lemma.append(t.upper())
else:
lemma.append(t)

text = ' '.join(lemma)

最新更新