UnicodeDecodeError:'utf-8'编解码器无法解码位置 886 中的字节0xa3:无效的起始字节:jsonlines



我正在尝试从json文件中读取行,但我得到以下错误:

回溯(最近一次调用):文件"insertion_script.py",行12日,在for line in f.t iter(): File "C:UsersAdministratorAnaconda3libsite-packagesjsonlinesjsonlines.py",第204行,在iter中skip_empty=skip_empty) File "C:UsersAdministratorAnaconda3libsite-packagesjsonlinesjsonlines.py"第143行,读到lineno, line = next(self._line_iter)文件"C:UsersAdministratorAnaconda3libcodecs.py",行322,在解码(result, consume) = self。_buffer_decode(数据、自我。错误,最后一个)UnicodeDecodeError: 'utf-8'编解码器无法解码字节0xa3的位置无效起始字节

BH_data = []
with jsonlines.open('2401659.jsonl','r') as f:
for line in f.iter():
BH_data.append(line)

这意味着您的数据实际上不是UTF-8格式。0xA3恰好是Windows代码页中的英镑符号。你应该试试

import codecs
with codecs.open('2401659.jsonl','r',encoding='cp1252') as jfile:
with jsonlines.Reader(jfile) as f:

最新更新