我正在遵循他提供的文件使用的情感分析教程。这些是简单的。txt文件,当他运行相同的代码时,它工作得很好。但是当我运行它时,我得到了下面的错误:
with open("positive.txt","r") as f:
for line in f.read().split('n'):
analysis = TextBlob(line)
if analysis.sentiment.polarity > 0:
pos_correct += 1
pos_count +=1
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xf3 in position 4645: invalid continuation byte
我们怎么能有相同的代码和相同的文件,但我得到这个错误,他没有?
如果有帮助,这里有一个文件的链接。https://pythonprogramming.net/static/downloads/short_reviews/
更新我的问题。当我遇到这个问题时,我正在我的Mac上尝试这个。在我的Windows电脑上试用了一下,效果很好。你知道会有什么不同吗?一切都一样。
似乎文件没有在utf-8
中编码。你能试着用io打开这个文件吗?用latin-1
编码打开吗?
from textblob import TextBlob
import io
# dummy variables initialization
pos_correct = 0
pos_count = 0
with io.open("positive.txt", encoding='latin-1') as f:
for line in f.read().split('n'):
analysis = TextBlob(line)
if analysis.sentiment.polarity > 0:
pos_correct += 1
pos_count +=1