我正在使用Python阅读HTML文档。它有许多字符,如x93
,x94
,xa0
。我认为它们对应于拉丁语-1 补充编码。有没有处理这个问题的图书馆?
您可以在python中简单地对拉丁语1中的字符串进行编码和解码:string.decode('latin1')