解析数据框中两种不同格式的日期



我有一列有 2 种不同格式的日期,我正在尝试使用熊猫to_datetime将其转换为日期时间这是代码

import pandas as pa
pa.to_datetime(data["servertime"], format="%a %b %d %H:%M:%S %Y")

例如 - 服务器时间周二 11月 4 12:01:15 2014

但很少有行具有以下格式的数据u'2014-11-04 13:15:13 +0000'抛出错误

如何解析同一行中存在的两种不同格式?

如果我不能,那么我如何转换/删除/标记行(最好没有硬编码条件)?

而不是使用 to_datetime() ,首先用 dateutil.parser.parse() 解析你的字符串:

In [2]: from dateutil.parser import parse
In [3]: dt1 = "Tue Nov 4 12:01:15 2014"
In [4]: dt2 = "2014-11-04 13:15:13 +0000"
In [5]: parse(dt1)
Out[5]: datetime.datetime(2014, 11, 4, 12, 1, 15)
In [6]: parse(dt2)
Out[6]: datetime.datetime(2014, 11, 4, 13, 15, 13, tzinfo=tzutc())

然后,可以将datetime.datetime值馈送到数据框中。

相关内容

  • 没有找到相关文章

最新更新