我想取出孟加拉文本的单词云,但是打印时,每个单词的辅音是分开打印的。
data = pd.read_csv('/content/gdrive/MyDrive/data.csv',encoding='UTF-8')
refined_sentence = " ".join(data)
regex = r"[u0980-u09FF]+"
wc = WordCloud(width=800, height=400, mode="RGBA",background_color=None, colormap="hsv",
stopwords = stopwords, font_path="kalpurush.ttf", regexp=regex).generate(refined_sentence)
plt.figure(figsize=(7, 7))
plt.imshow(wc, interpolation='none')
plt.axis("off")
plt.show()
我遵循了这个评论,最终可以在Ubuntu中解决这个问题。
步骤1sudo apt-get install libfreetype6-dev libbharfbuzzz -dev libfribidi-dev gtk-doc-tools
步骤2: !wget -O raqm-0.7.0.tar.gz https://raw.githubusercontent.com/python-pillow/pillow-depends/master/raqm-0.7.0.tar.gz
现在raqm-0.7.0.tar.gz文件应该在您的下载部分。步骤3: !tar -xzvf raqm-0.7.0.tar.gz 步骤4cd raqm-0.7.0 第5步: !/configure——prefix=/usr &&Make -j4 &&Sudo make -j4 install 步骤6现在你只需要重新安装Pillow库。激活正确的环境。然后执行以下命令: python3 -m PIP install——upgrade PIPpython3 -m pip install——upgrade Pillow 就是这样!现在你有了一个工作的Pillow库,可以在图像中生成合适的孟加拉语和其他印度语字体。