pyspark.sql.functions.from_utc_timestamp()中的tz参数



嗨,我目前正在通过Spark处理时间序列数据,并处理时区。

SparkSQL的一些内置函数使用了特定的时区参数,例如:

pyspark.sql.functions.from_utc_timestamp(timestamp, tz)
Assumes given timestamp is UTC and converts to given timezone.
>>> df = sqlContext.createDataFrame([('1997-02-28 10:30:00',)], ['t'])
>>> df.select(from_utc_timestamp(df.t, "PST").alias('t')).collect()
[Row(t=datetime.datetime(1997, 2, 28, 2, 30))]
New in version 1.5.

在我的情况下,使用短手时区可能不方便,因为时区信息以"+01:00"的格式存储。

所以我的问题是:如何将"+01:00"格式的偏移字符串合并到spark数据帧中,以便将偏移量考虑在内

您可以使用GMT+01:00,如中所述java.util.TimeZone文档

相关内容

  • 没有找到相关文章

最新更新