我有一个看似简单的问题,但我找不到直接的答案。我想编写一个函数,该函数将两个字符串作为输入并给出一个整数作为输出。
在 R 中,函数非常简单:
utc_seconds = function(date_string, tz) as.integer(as.POSIXct(date_string, tz = tz))
我控制着date_string
,并且知道格式总是正确的,例如 2018-02-11 00:00:00
,我也知道tz
将永远是奥尔森格式。
示例输入/输出:
utc_seconds('2018-02-11 00:00:00', tz = 'Asia/Singapore')
# 1518278400
我看过datetime
、pytz
、time
等的各种组合/排列,但无济于事。这张桌子看起来很有希望,但最终我不知道如何使用它。
我已经管理了一个"黑客",如下所示,但这感觉很愚蠢(向我的输入字符串添加无关信息(:
from dateutil.parser import parse
from dateutil.tz import gettz
parse("2018-02-01 00:00:00 X", tzinfos={'X': gettz('Asia/Singapore')})
# datetime.datetime(2018, 2, 11, 0, 0, tzinfo=tzfile('/usr/share/zoneinfo/Asia/Singapore'))
但我也无法将其带到UTC时间。
您可以使用日期时间timestamp
来获取纪元时间
from datetime import datetime
import pytz
def utc_seconds(str_dt, timezone):
timezone = pytz.timezone(timezone)
dt = datetime.strptime(str_dt, '%Y-%m-%d %H:%M:%S')
dt_timezone = timezone.localize(dt)
return int(dt_timezone.timestamp())
utc_seconds('2018-02-11 00:00:00', 'Asia/Singapore')
# 1518278400
在 @Udayraj Deshmukh 的推动下,我拼凑了以下内容:
from dateutil.parser import parse
from pytz import timezone, utc
from datetime import datetime
def utc_seconds(input, tz):
tz = timezone(tz)
dt = tz.localize(parse(input), is_dst = None)
return int((dt - datetime(1970, 1, 1, tzinfo = utc)).total_seconds())
utc_seconds('2018-02-11 00:00:00', 'Asia/Singapore')
# 1518278400
我还想出了以下替代方案,因为我的设置已经绑定到 Spark 上下文中:
def utc_seconds(input, tz):
query = "select unix_timestamp(to_utc_timestamp('{dt}', '{tz}'))"
.format(dt = input, tz = tz)
return spark.sql(query).collect()[0][0]
(即,将罐子踢到更友好的语言并收集结果(