假设我有一个带有timestamp
的csv
,但格式未定义。它可以是任何格式,带有任何分隔符,例如 -
mm/dd/yyyy hh:mm
或dd/mm/yyyy hh:mm:ss
或mm-dd-yyyy hh:mm
或dd-mm-yyyy hh:mm:ss
或只是这样。
我正在尝试解析任何格式的日期。
这里:
dateparse = lambda dates: datetime.strptime(dates, '%m/%d/%Y %H:%M')
我们定义了以下格式的日期解析:%m/%d/%Y %H:%M
如果有人能给出任何有价值的建议,那么这将是有帮助的。
pandas.read_csv
有一个infer_datetime_format
参数:
infer_datetime_format:布尔值,默认值为假
如果启用了 True 和 parse_dates,pandas 将尝试推断列中日期时间字符串的格式,如果可以推断,请切换到更快的解析方法。在某些情况下,这可以将解析速度提高 ~5-10 倍。