作为日志记录系统的一部分,我想解析来自思科设备的字符串时间戳,该设备具有以下格式:
# show clock
16:26:19.990 GMT+1 Wed Sep 11 2013
解析结果应该是将存储在SQLite数据库中的UTC datetime
实例,因此需要进行时区转换。
仅使用datetime.strptime
是不够的,因为%Z
指令仅识别本地时区(即与当前$LANG
或$LC_*
环境相关的时区)。 因此,我需要使用 pytz 包。
由于格式始终相同,因此我可以执行以下操作:
import pytz
from datetime import datetime
s = '16:26:19.990 CEST Wed Sep 11 2013'
tm, tz, dt = s.split(" ", 2)
naive = datetime.strptime("%s %s" % (tm, dt), "%H:%M:%S.%f %a %b %d %Y")
aware = naive.replace(timezone=pytz.timezone(tz))
universal = aware.astimezone(pytz.UTC)
但是,如果不进行一些修改,这将无法正常工作。 必须将 tz
的值更正为 pytz 识别的名称。 在此示例中,pytz.timezone('CEST')
引发UnknownTimezoneError
,因为实际时区为 CET
。 问题是不应用夏令时校正:
>>> from datetime import datetime
>>> from pytz import UTC, timezone
>>> a = datetime.strptime('16:18:57.925 Wed Sep 11 2013', '%H:%M:%S.%f %a %b %d %Y')
>>> b = a.replace(tzinfo=timezone('CET'))
>>> a
datetime.datetime(2013, 9, 11, 16, 18, 57, 925000)
>>> b
datetime.datetime(2013, 9, 11, 16, 18, 57, 925000, tzinfo=<DstTzInfo 'CET' CET+1:00:00 STD>)
>>> b.astimezone(UTC)
datetime.datetime(2013, 9, 11, 15, 18, 57, 925000, tzinfo=<UTC>)
使用normalize
似乎无济于事:
>>> timezone('CET').normalize(a)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "/home/etanol/virtualenvs/plexus/local/lib/python2.7/site-packages/pytz/tzinfo.py", line 235, in normalize
raise ValueError('Naive time - no tzinfo set')
ValueError: Naive time - no tzinfo set
>>> timezone('CET').normalize(b)
datetime.datetime(2013, 9, 11, 17, 18, 57, 925000, tzinfo=<DstTzInfo 'CET' CEST+2:00:00 DST>)
我真的不知道我错过了什么,但想要的结果是:
datetime.datetime(2013, 9, 11, 14, 18, 57, 925000, tzinfo=<UTC>)
提前谢谢。
使用 timezone.localize
:
>>> from datetime import datetime
>>> from pytz import UTC, timezone
>>>
>>> CET = timezone('CET')
>>>
>>> a = datetime.strptime('16:18:57.925 Wed Sep 11 2013', '%H:%M:%S.%f %a %b %d %Y')
>>> print CET.localize(a).astimezone(UTC)
2013-09-11 14:18:57.925000+00:00