如何解码和编码希伯来语字符串



我正在尝试编码和解码希伯来语字符串"שלום"。但是,编码后,我得到胡言乱语:

>>> word = "שלום"
>>> word = word.decode('UTF-8')
>>> word
u'u05e9u05dcu05d5u05dd'
>>> print word
שלום
>>> word = word.encode('UTF-8')
>>> word
'xd7xa9xd7x9cxd7x95xd7x9d'
>>> print word
׳©׳׳•׳

我应该如何正确执行此操作?

您必须确保环境中具有正确的编码(shell 或脚本)。如果您使用的是脚本,请包括以下内容:

#!/usr/bin/env python
# -*- coding: utf-8 -*-

确保您的环境知道您正在使用 UTF-8。您可能会发现您的 shell 终端只接受 ASCII,因此请确保它能够支持 UTF-8。

>>> word = "שלום"
>>> word
'xd7xa9xd7x9cxd7x95xd7x9d'
>>> print word
שלום
>>> word = word.decode('UTF-8')
>>> word
u'u05e9u05dcu05d5u05dd'
>>> print word
שלום
>>> word = word.encode('UTF-8')
>>> word
'xd7xa9xd7x9cxd7x95xd7x9d'
>>> print word
שלום
>>>

最新更新