限制特定日期后的帖子输出(熊猫)



我有一个带有时间序列的常规数据帧。如何从特定值推断日期字段?我尝试应用pd.to_datetime,但有些日期开始错误地显示月份和日期(交换它们(。也就是说,出现以下情况:07-02-20222022-07-02,但应该是2020-02-07

以下是我的一个片段:

date          infected_in_day
0     07-02-2022    15442.0
1     06-02-2022    18856.0
2     05-02-2022    22444.0
...
214   02-07-2021    6893.0
229   16-06-2021    5782.0
235   11-12-2020    40.0
236   09-12-2020    42.0
237   08-12-2020    41.0

我需要按日期16-06-2021过滤数据,也就是说,不显示以前的所有内容。像这样:

date          infected_in_day
0     07-02-2022    15442.0
1     06-02-2022    18856.0
2     05-02-2022    22444.0
...
214   02-07-2021    6893.0
229   16-06-2021    5782.0

有没有什么方法可以在不使用pd.to_datetime的情况下做到这一点?或者如何做对?

日期列似乎有问题。如果我的假设是正确的,我会尝试解析数据,就像我期望的那样:

mydateparser = lambda x: pd.datetime.strptime(x, "%Y %m %d %H:%M:%S")
df = pd.read_csv("file.csv", sep='t', parse_dates=['date'], date_parser=mydateparser)

最新更新