Unicode解码错误:'utf-8'编解码器无法解码位置 3118 中的字节0x97:起始字节无效 简单文本文件



我正在遵循他提供的文件使用的情感分析教程。这些是简单的。txt文件,当他运行相同的代码时,它工作得很好。但是当我运行它时,我得到了下面的错误:

with open("positive.txt","r") as f:
for line in f.read().split('n'):
analysis = TextBlob(line)
if analysis.sentiment.polarity > 0:
pos_correct += 1
pos_count +=1
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xf3 in position 4645: invalid continuation byte

我们怎么能有相同的代码和相同的文件,但我得到这个错误,他没有?

如果有帮助,这里有一个文件的链接。https://pythonprogramming.net/static/downloads/short_reviews/

更新我的问题。当我遇到这个问题时,我正在我的Mac上尝试这个。在我的Windows电脑上试用了一下,效果很好。你知道会有什么不同吗?一切都一样。

似乎文件没有在utf-8中编码。你能试着用io打开这个文件吗?用latin-1编码打开吗?

from textblob import TextBlob
import io
# dummy variables initialization
pos_correct = 0
pos_count = 0
with io.open("positive.txt", encoding='latin-1') as f:
for line in f.read().split('n'):
analysis = TextBlob(line)
if analysis.sentiment.polarity > 0:
pos_correct += 1
pos_count +=1

相关内容

  • 没有找到相关文章