如何使我的 python 代码能够从 Excel 中的阿拉伯语内容中读取



我有两个相关的问题。我正在使用Excel处理阿拉伯语数据集。我认为 Excel 以某种方式将内容读取为 ؟؟؟؟؟,因为当我尝试用这个"?"替换这个字符"؟"时,它会替换工作表中的整个文本。但是当我替换或搜索另一个字母时,它会起作用。

其次,我尝试使用 python 编辑工作表,但我无法写阿拉伯字母(我使用的是 jGRASP(。例如,当我写字母"ل"时,它显示为 0644,当我运行代码时,出现此消息:"ُ编码文本时出错。无法使用字符集窗口-1252 对文本进行编码"。

0644 是十六进制字符的字符代码。 jGRASP 在字体不包含字符时显示该字符。您可以使用jGRASP中的"设置">"字体"来选择包含所需字符的CSD字体。找到具有这些字符并且也可以很好地用作编码字体的字体可能无法找到,因此您可能需要在两种字体之间切换。

jGRASP默认使用系统字符编码来加载和保存文件。Windows-1252 是英语 Windows 系统上使用的 8 位编码。您可以使用"文件">"另存为"来保存名称相同但编码不同的文件(字符集(。一旦你这样做,jGRASP会记住它(每个文件(,你可以正常加载和保存。或者,您可以使用"设置">"CSD Windows设置">"工作区",并更改"默认字符集"设置以使默认值与系统默认值不同。

最新更新