我在将'\xc3\xd8\xe8\xa7\xc3\xb4\xd'(泰语文本)转换为可读格式时遇到问题。我从智能卡中获取此值,它基本上适用于Windows,但不适用于Linux。
如果我在 Python 控制台中打印,我会得到:
����ô
我试图遵循一些谷歌提示,但我无法实现我的目标。
任何建议不胜感激。
您的文本似乎不是 Unicode 文本。相反,它看起来像是泰国的编码之一。因此,您必须在打印文本之前了解编码。
例如,如果我们假设您的数据是用TIS-620编码的(最后一个字符是xd2
而不是xd
),那么它将是"รุ่งรฃา"。
要在 Python 中使用非 Unicode 字符串,您可以尝试:myString.decode("tis-620")
甚至sys.setdefaultencoding("tis-620")