在jupyter笔记本中,我使用panda打开了一个csv文件,其中包含与游戏相关的数据,包括游戏的最后更新日期。我想删除具有最后更新日期<6个月。它的语法是什么?
列名是当前版本的发布日期。日期格式为dd/mm/yyyy。
csv文件有2240行。我想删除日期在6个月后的时间范围内的行,即11月25日至4月25日之间的所有日期都必须删除。
样本数据:
Date
20/05/2017
15/01/2020
13/05/2018
01/11/2019
.
.
15/02/2019
13/03/2020
2240行以这种方式
使用boolean indexing
按列进行筛选Date
由to_datetime
:转换为日期时间
df = pd.read_csv(file)
df['Date'] = pd.to_datetime(df['Date'], dayfirst=True)
now = pd.Timestamp.now().floor('D')
previous = now - pd.DateOffset(months=6)
df1 = df[(df['Date'] < previous) | (df['Date'] > now)]
print (df1)
Date
0 2017-05-20
2 2018-05-13
4 2019-02-15
对于字符串格式的日期时间,请使用:
df['Date'] = df['Date'].dt.strftime(%d/%m/%Y)