我有两个数据帧:
cash_flows
coupon_date
1 2026-07-31
2 2026-01-31
3 2025-07-31
4 2025-01-31
5 2024-07-31
6 2024-01-31
discount_rates
date df
1 2023-07-25 0.9806698
2 2024-07-25 0.9737091
3 2025-07-25 0.9432057
4 2026-07-27 0.9109546
5 2027-07-26 0.8780984
我想用discount rates
中dr
列的线性插值在cash flows
中创建一个新列。
因此,所需输出为:
cash_flows
coupon_dates new_column
1 2026-07-31 0.910594
2 2026-01-31 0.926509
3 2025-07-31 0.942678
4 2025-01-31 0.957831
5 2024-07-31 0.973208
6 2024-01-31 0.977056
我已经下载了forecast
软件包,但仍然不完全确定如何实现这一点。感谢您的帮助。
复制数据帧的代码:
cash_flows <- data.frame(coupon_date = as.Date(c("2026-07-31","2026-01-31","2025-07-31", "2024-07-31","2024-01-31")))
drdr <- data.frame(date = as.Date(c("2023-07-25","2024-07-25","2025-07-25", "2026-07-27","2027-07-26")), df = c(0.9806698, 0.9737091, 0.9432057, 0.9109546, 0.8780984))
?approx
可用于线性插值
传递drdr
数据中的源x
和y
变量,并指定要知道基于cash_flows$coupon_date
x
值(xout=
(的插值输出y
值:
cash_flows$new_column <- approx(x=drdr$date, y=drdr$df, xout=cash_flows$coupon_date)$y
cash_flows
# coupon_date new_column
#1 2026-07-31 0.9105935
#2 2026-01-31 0.9265089
#3 2025-07-31 0.9426784
#4 2024-07-31 0.9732077
#5 2024-01-31 0.9770563
与您期望的输出完全匹配(cash_flows
中的一行除外,该行不在您的代码中以复制data.frames,但在问题的前面显示(。
这里有一个选项。我们拟合了一个线性模型df ~ date
到drdr
。然后使用predict
来估计cash_flows
中的日期的df
。请注意,这些数字与您的预期输入并不完全匹配。
fit <- lm(df ~ date, data = drdr)
cash_flows %>%
mutate(new_column = predict(fit, newdata = data.frame(date = coupon_date)))
# coupon_date new_column
#1 2026-07-31 0.9101729
#2 2026-01-31 0.9234352
#3 2025-07-31 0.9369172
#4 2024-07-31 0.9636614
#5 2024-01-31 0.9769969