我有一个带有时间序列的常规数据帧。如何从特定值推断日期字段?我尝试应用pd.to_datetime
,但有些日期开始错误地显示月份和日期(交换它们(。也就是说,出现以下情况:07-02-2022
到2022-07-02
,但应该是2020-02-07
。
以下是我的一个片段:
date infected_in_day
0 07-02-2022 15442.0
1 06-02-2022 18856.0
2 05-02-2022 22444.0
...
214 02-07-2021 6893.0
229 16-06-2021 5782.0
235 11-12-2020 40.0
236 09-12-2020 42.0
237 08-12-2020 41.0
我需要按日期16-06-2021
过滤数据,也就是说,不显示以前的所有内容。像这样:
date infected_in_day
0 07-02-2022 15442.0
1 06-02-2022 18856.0
2 05-02-2022 22444.0
...
214 02-07-2021 6893.0
229 16-06-2021 5782.0
有没有什么方法可以在不使用pd.to_datetime
的情况下做到这一点?或者如何做对?
日期列似乎有问题。如果我的假设是正确的,我会尝试解析数据,就像我期望的那样:
mydateparser = lambda x: pd.datetime.strptime(x, "%Y %m %d %H:%M:%S")
df = pd.read_csv("file.csv", sep='t', parse_dates=['date'], date_parser=mydateparser)