从Twitter API转换Python中的时区+格式



在Python中,使用TwitterSearch,我可以以UTC时间获得推文的时间戳,格式如下:

Thu Mar 19 12:37:15 +0000 2015

然而,我想在EST时区(UTC-4)自动获得它,格式如下:

2015-03-19 08:37:15

这是我的代码示例。要进行自动转换,我应该在其中更改什么?

            for tweet in ts.search_tweets_iterable(tso):
            lat = None
            long = None
            user = tweet['user']['screen_name']
            user_creation = tweet['user']['created_at']
            created_at = tweet['created_at'] # UTC time when Tweet was created.
            favorite = tweet['favorite_count']
            retweet = tweet ['retweet_count']
            id_status = tweet['id']
            in_reply_to = tweet['in_reply_to_screen_name']
            followers = tweet['user']['followers_count'] # nombre d'abonnés
            statuses_count = tweet['user']['statuses_count'] # nombre d'abonnés
            location = tweet['user']['location'] # résidence du twittos
            tweet_text = tweet['text'].strip() # deux lignes enlèvent espaces inutiles
            tweet_text = ''.join(tweet_text.splitlines())
            print i,created_at,user_creation,user, tweet_text
            if tweet['geo'] and tweet['geo']['coordinates'][0]: 
                lat, long = tweet['geo']['coordinates'][:2]
                print u'@%s: %s' % (user, tweet_text), lat, long
            else:
                print u'@%s: %s' % (user, tweet_text)
            print favorite,retweet,id_status,in_reply_to,followers,statuses_count,location
            writer.writerow([user.encode('utf8'), user_creation.encode('utf8'), created_at.encode('utf8'), 
                             tweet_text.encode('utf8'), favorite, retweet, id_status, in_reply_to, followers, statuses_count, location.encode('utf8'), lat, long])
            i += 1
            if i > max:
                return()

提前谢谢!

Florent

如果EST是您的本地时区,那么您可以只使用stdlib:

#!/usr/bin/env python
from datetime import datetime
from email.utils import parsedate_tz, mktime_tz
timestamp = mktime_tz(parsedate_tz('Thu Mar 19 12:37:15 +0000 2015'))
s = str(datetime.fromtimestamp(timestamp))
# -> '2015-03-19 08:37:15'

它也支持非UTC输入时区。

或者您可以明确指定目的地时区:

import pytz # $ pip install pytz
dt = datetime.fromtimestamp(timestamp, pytz.timezone('US/Eastern'))
s = dt.strftime('%Y-%m-%d %H:%M:%S')
# -> '2015-03-19 08:37:15'

你可以把它放在一个函数中:

#!/usr/bin/env python
from datetime import datetime
from email.utils import parsedate_tz, mktime_tz
def to_local_time(tweet_time_string):
    """Convert rfc 5322 -like time string into a local time
       string in rfc 3339 -like format.
    """
    timestamp = mktime_tz(parsedate_tz(tweet_time_string))
    return datetime.fromtimestamp(timestamp).strftime('%Y-%m-%d %H:%M:%S')
time_string = to_local_time('Thu Mar 19 12:37:15 +0000 2015')
# use time_string here..

从twitter发送的日期中删除+0000,并执行以下操作:

from datetime import datetime
import pytz
local = 'Europe/London' #or the local from where twitter date is coming from
dt = datetime.strptime("Thu Mar 19 12:37:15 2015", "%a %b %d %H:%M:%S %Y")
dt = pytz.timezone(local).localize(dt)
est_dt = dt.astimezone(pytz.timezone('EST'))
print est_dt.strftime("%Y-%m-%d %H:%M:%S")

输出:

2015-03-19 07:37:15

或者,你可以做一些类似的事情(在这种情况下,你不需要删除+0000时区信息):

from dateutil import parser
dt = parser.parse("Thu Mar 19 12:37:15 +0000 2015")
est_dt = dt.astimezone(pytz.timezone('EST'))
print est_dt.strftime("%Y-%m-%d %H:%M:%S")

输出

2015-03-19 07:37:15

顺便问一下,EST是UTC-4还是UTC-5?

相关内容

  • 没有找到相关文章

最新更新