替换数据框列中每个值的日期数字



我正在尝试使用另一列中的值替换日期时间列中的日期数字值。

这是我的数据帧:

    ID   Code   Day_to_replace  Base_date
0   123  403        28          22/02/2013
1   456  402        21          22/03/2011
2   789  401        14          01/05/2017

这就是我想要的结局:

    ID   Code   Day_to_replace  Base_date    New_Date
0   123  403    28              22/02/2013   28/02/2013
1   456  402    21              22/03/2011   21/03/2011
2   789  401    14              01/05/2017   14/05/2017

我可以使用静态值来执行此操作,但无法弄清楚如何使用另一列中的值应用于每条记录。

newdf['New_Date'] = newdf['Base_Date'].apply(lambda x: x.replace(day=1))

谢谢

首先将值转换为日期时间:

df['Base_date'] = pd.to_datetime(df['Base_date'], format='%d/%m/%Y')

DataFrame.apply与每行的 axis=1 for 循环一起使用:

df['New_Date'] = df.apply(lambda x: x['Base_date'].replace(day=x['Day_to_replace']), axis=1)

或者将日期时间转换为月周期,然后返回第一天,并将天数时间增量减去1 to_timedelta

df['New_Date'] = (df['Base_date'].dt.to_period('m').dt.to_timestamp() +  
                  pd.to_timedelta(df['Day_to_replace'].sub(1), unit='d'))

或者将值转换为字符串,添加天数并转换为日期时间:

df['New_Date'] = pd.to_datetime(df['Base_date'].dt.strftime('%Y-%m-') + 
                                df['Day_to_replace'].astype(str))

print (df)
    ID  Code  Day_to_replace  Base_date   New_Date
0  123   403              28 2013-02-22 2013-02-28
1  456   402              21 2011-03-22 2011-03-21
2  789   401              14 2017-05-01 2017-05-14

最新更新