Python中的特殊HTML字符转换为ASCII



我想将我在网页阅读期间看到的特殊字符转换为ASCII格式。我试了很多次,但我还是不明白。下面我将给出一些在Python中存储在字符串中的示例。我不知道当前网页的编码是什么,但我想将其转换为ASCII格式。

Apaydın Ünal > want this to Apaydin Unal
Íñigo Martínez > want this to Inigo Martinez
Üstünel > want this to Ustunel

谁能帮我?

编辑:谢谢,我忘了。我使用Python 2.7

试试https://pypi.python.org/pypi/Unidecode:

>>> from unidecode import unidecode
>>> unidecode(u'kou017euu0161u010dek')
'kozuscek'

要检测编码,请参见问题确定Python中文本的编码

相关内容

  • 没有找到相关文章

最新更新