我正在从.htm文件中解析/提取unicode,并将它们存储为变量。问题是,我想把它打印成纯文本/字母。这是我的代码:
with open("Peribahasa.htm", "r") as Peribahasa_File:
for line in itertools.islice(Peribahasa_File, 1000, 1150):
for item in line.split("n"):
if "I[0][1][0][0]" in item:
answer_1 = (((item.strip()).replace("I[0][1][0][0] = '", "")).replace("';", ""))
print(answer_1.encode('utf-8'))
但是,最终打印行将其打印为->b'\u0044'作为参考,answer_1变量为->\u0044
我只需要把\u0044转换成字母D
任何帮助都将不胜感激!我已经做了好几个小时了,谢谢!
我使用Python 3
尝试以下操作:
answer_1.encode().decode('unicode_escape')