我有一列有 2 种不同格式的日期,我正在尝试使用熊猫to_datetime将其转换为日期时间这是代码
import pandas as pa
pa.to_datetime(data["servertime"], format="%a %b %d %H:%M:%S %Y")
例如 - 服务器时间周二 11月 4 12:01:15 2014
但很少有行具有以下格式的数据u'2014-11-04 13:15:13 +0000'抛出错误
如何解析同一行中存在的两种不同格式?
如果我不能,那么我如何转换/删除/标记行(最好没有硬编码条件)?
而不是使用 to_datetime()
,首先用 dateutil.parser.parse()
解析你的字符串:
In [2]: from dateutil.parser import parse
In [3]: dt1 = "Tue Nov 4 12:01:15 2014"
In [4]: dt2 = "2014-11-04 13:15:13 +0000"
In [5]: parse(dt1)
Out[5]: datetime.datetime(2014, 11, 4, 12, 1, 15)
In [6]: parse(dt2)
Out[6]: datetime.datetime(2014, 11, 4, 13, 15, 13, tzinfo=tzutc())
然后,可以将datetime.datetime
值馈送到数据框中。