在jupyter笔记本中,我使用panda打开了一个csv文件,其中包含与游戏相关的数据,包括它们的最后更新日期



在jupyter笔记本中,我使用panda打开了一个csv文件,其中包含与游戏相关的数据,包括游戏的最后更新日期。我想删除具有最后更新日期<6个月。它的语法是什么?

列名是当前版本的发布日期。日期格式为dd/mm/yyyy。

csv文件有2240行。我想删除日期在6个月后的时间范围内的行,即11月25日至4月25日之间的所有日期都必须删除。

样本数据:

Date
20/05/2017
15/01/2020
13/05/2018
01/11/2019
.
.
15/02/2019
13/03/2020

2240行以这种方式

使用boolean indexing按列进行筛选Dateto_datetime:转换为日期时间

df = pd.read_csv(file)
df['Date'] = pd.to_datetime(df['Date'], dayfirst=True)
now = pd.Timestamp.now().floor('D')
previous =  now - pd.DateOffset(months=6)
df1 = df[(df['Date'] < previous) | (df['Date'] > now)]
print (df1)
Date
0 2017-05-20
2 2018-05-13
4 2019-02-15

对于字符串格式的日期时间,请使用:

df['Date'] = df['Date'].dt.strftime(%d/%m/%Y)

相关内容

最新更新