我在Python中有以下数据帧:日期列采用TimeStamp格式。
日期 | holiday_type | 名称 | 其他
---|---|---|
2022-01-01 00:00:00 | 假日 | 假日1英国 |
2022-01-02 00:00:00 | 假日 | 假日2英国 |
2022-03-08 00:00:00 | 假日 | 假日3英国 |
2022-04-12 00:00:00 | 假日 | 假日4英国 |
这可能是一种更有效的方法,但我是这样做的。
我创建了一个数据框架,将您的日期偏移一天。然后添加后缀'(Pre) '
,并将holiday_type
更改为'Pre Holiday'
。然后,我将它附加到原始数据帧中,排序并删除重复的日期,保留最后一个条目。
import pandas as pd
cols = ['date','holiday_type','name','other']
data = [['2022-01-01 00:00:00', 'Holiday', 'Holiday 1', 'UK'],
['2022-01-02 00:00:00', 'Holiday', 'Holiday 2', 'UK'],
['2022-03-08 00:00:00', 'Holiday', 'Holiday 3', 'UK'],
['2022-04-12 00:00:00', 'Holiday', 'Holiday 4', 'UK']]
df = pd.DataFrame(data, columns=cols)
df['date'] = pd.to_datetime(df['date'])
df_yesterday = df[df['holiday_type'] == 'Holiday']
df_yesterday['date'] = df_yesterday['date'] + pd.offsets.Day(-1)
df_yesterday['holiday_type'] = 'Pre Holiday'
df_yesterday['name'] = '(Pre) ' + df_yesterday['name']
df = pd.concat([df, df_yesterday]).sort_values(['date', 'holiday_type'], ascending=[True, False]).reset_index(drop=True)
df = df.drop_duplicates(['date'], keep='last').reset_index(drop=True)
输出:
print(df)
date holiday_type name other
0 2021-12-31 Pre Holiday (Pre) Holiday 1 UK
1 2022-01-01 Holiday Holiday 1 UK
2 2022-01-02 Holiday Holiday 2 UK
3 2022-03-07 Pre Holiday (Pre) Holiday 3 UK
4 2022-03-08 Holiday Holiday 3 UK
5 2022-04-11 Pre Holiday (Pre) Holiday 4 UK
6 2022-04-12 Holiday Holiday 4 UK