如何取消词云中的"耶稣"的词干?



尝试使用wordcloud从一本圣经书中获取。png图像。"耶稣"这个词源于"耶稣"。有没有一种方法可以给这个单独的单词一个例外呢?奇怪的是,"摩西"一词没有词根。

{file_content = open("Wheres_Heaven.txt").read()}
{wordcloud = WordCloud(stopwords=None, background_color = 'white', width=1200, height=1000, max_words = 500, ).generate(file_content)}
{plt.figure( figsize=(20,10) )
{plt.imshow(wordcloud)}
{plt.axis('off')}
{plt.savefig('Heaven.png')}
{plt.show()}

Heaven.png

如果你的版本是1.8.1,那么你可以添加"Jesu"在stopwords。

逻辑是当它同时看到" jesus "one_answers";Jesus"在文本中,代码假定它是复数形式。显然,文本中没有"摩西",这就是为什么它没有被当作复数。

最新更新