Python 3 - 将 utf-8 编码的数据打印到控制台(不是"x00(x00Ax04")


r = requests.get('...', allow_redirects=True)
pagetext = r.text
tree = etree.HTML(pagetext)
node = tree.xpath('...')[0]
out = str(etree.tostring(node, method='text', encoding='UTF8'))
print(out) // some "x00(x00Ax04>x042x04<x045x04A"-like thing is printed

我已经在字符串的不同部分尝试了各种 .encode('UTF-8'(,但仍然没有运气:(

那不是 UTF-8。

3>> b"x00(x00Ax04>x042x04<x045x04A".decode('utf-16be')
'(Aовмес'

请注意,"utf-16be"是根据你的样本数据选择的;它更有可能是UTF-16LE。

最新更新