抓取 tweet with python 遇到 UnicodeEncodeError



我正在尝试使用Twittter API和Python抓取推文的文本

我使用 oauth 登录并获取生成的字典:

jsonTweets = json.loads(response)
list = jsonTweets["statuses"]   # list of dictionaries
type(jsonTweets)  #returns dict
type(list)    #returns list
type(list[0])    #return dict (it's a list of dictionaries)

list[0] 是一个字典:

{u'contributors': None, u'truncated': False, u'text': u'RT @Kagame_quotes: "We, the people of #Rwanda, our country has its own problems that we canu2019t attribute to others, we need to find solutionu2026', u'in_reply_to_status_id': None, u'id': 387905246028394496L, u'favorite_count': 0, u'source': u'<a href="http://twitter.com" rel="nofollow">Twitter Web Client</a>', u'retweeted': False, u'coordinates': None,等...

我只想获取u'text'键的值(即获取推文(

所以我写:

for item in list:
    print item[u'text']

但这给了我一个错误:

UnicodeEncodeError: 'ascii' codec can't encode character u'u2019'
in position 91: ordinal not in range(128)

如何获取u'text'键的值?

您需要指定 UTF-8 编码:

for item in list:
    print item[u'text'].encode('utf-8')

这应该可以解决问题。

你的文字没有错。它只包含 unicode 字符,您无法在 consolle 上打印这些字符。

特别是(查看此 http://www.utf8-chartable.de/unicode-utf8-table.pl(:

  • U+2019 右单引号
  • U+2026 水平椭圆

相关内容