如何用多语言文本准备数据集



我正在为Jupyter Notebook中的文本分类准备一个数据集。

但是,其中一列有包含印尼语和英语单词的文本句子Example: 'ETUDE READY NO. 4 DAN 5nnTulis di keterangan'

有人可以建议我应该如何预处理此文本列吗

有n种方法可以转换数据帧。作为一名开发人员,我建议做一些基础的互联网研究。我在这里删除了一些链接。。

链接1:https://pretagteam.com/question/translate-dataframe-python-to-english-and-save-the-result-into-a-cvs-file

链接2:如何在熊猫数据帧中将其他语言翻译成英语

Link3:Python-pandas:通过转换存储在中国传统中的不同列中的值,创建一个包含英文值的新列

最新更新