时间戳列格式不固定,有些行ddmyy,有些行mmdyy



我目前正在处理多个数据集,时间戳列:dd/mm/yyyy HH: mm每日数据间隔5分钟我想重新采样数据集以填充缺失的日期和时间戳

问题是少数数据集有一些行作为ddmyy,然后突然格式化

在前100行之后更改为ddmmyy,然后再次更改为ddmmyy,没有任何模式…

需要解决方案或帮助纠正此问题

我使用的代码:::

df['Timestamp'] = pd.to_datetime(df['Timestamp'])
df['Timestamp'] = df.Timestamp.dt.strftime('%d/%m/%y %H:%M')
df['Timestamp'] = pd.to_datetime(df['Timestamp'])

start_dt = df.loc[0, "Timestamp"]
end_dt = df["Timestamp"].iloc[-1]
r = pd.date_range(start=start_dt, end=end_dt, freq="5min")
# Reindexing by adding missing dates

df = df.set_index('Timestamp').reindex(r).rename_axis("Timestamp").reset_index()

使用正则表达式筛选包含ddmyy &然后转换为日期时间格式。

最新更新