我们可以从csv文件中自动检测给定列的日期时间格式吗?



假设我有一个带有timestampcsv,但格式未定义。它可以是任何格式,带有任何分隔符,例如 -

mm/dd/yyyy hh:mmdd/mm/yyyy hh:mm:ssmm-dd-yyyy hh:mmdd-mm-yyyy hh:mm:ss或只是这样。

我正在尝试解析任何格式的日期。

这里:

dateparse = lambda dates: datetime.strptime(dates, '%m/%d/%Y %H:%M')

我们定义了以下格式的日期解析:%m/%d/%Y %H:%M

如果有人能给出任何有价值的建议,那么这将是有帮助的。

pandas.read_csv有一个infer_datetime_format参数:

infer_datetime_format:布尔值,默认值为假

如果启用了 True 和 parse_dates,pandas 将尝试推断列中日期时间字符串的格式,如果可以推断,请切换到更快的解析方法。在某些情况下,这可以将解析速度提高 ~5-10 倍。

最新更新