我正在尝试创建一个函数来计算滚动cumprod
。该函数必须允许滑动窗口。我得到了以下数据:
set.seed(1)
library(zoo)
test1 <- data.table(time=as.yearmon(2000 + seq(0, 35)/12),a=rep(1:12,3),outcome1=rep(cumprod(1:12),3))
test2 <- data.table(time=as.yearmon(2000 + seq(0, 35)/12),a=rep(rnorm(36)))
test2[,outcome2:=c(NA,NA,cumprod(test2$a[3:8]),rep(NA,6),cumprod(test2$a[15:20]),rep(NA,6),cumprod(test2$a[27:32]),rep(NA,4))]
test1 只是简单地计算 12 个月内的 cumprod,然后再次计算,等等,以说明没有滑动窗口的想法。 test2 显示了预期的计算:从示例 3 月到 8 月,然后是 6 个月的空窗口,然后下一次计算在明年 3 月开始。
不久前,我尝试创建一个解决方案,为一个相当大的数据集手动计算起点和终点,但循环中的函数太慢/不可行。我相信有了zoo
,这可能会更快。我正在测试以下内容:
rollapply(c(1:12,1:12), width = 12, prod, partial = TRUE, align = "right")
..但到目前为止,无法在 12 个月后使其正确重置。此外,无法在 rollapply 中添加带有by
的窗口。任何提示都值得赞赏!
请注意,我的完整数据集并不总是在一月份开始,因此索引并不容易。我想避免在这里使用面板以保持简单。
如果ym
是年份向量,则as.integer(ym)
是年份,cycle(ym)
是月份数字,因此:
test1[, out := cumprod(a), by = as.integer(time)]
test2[, out := cumprod(ifelse(cycle(time) %in% 3:8, a, NA)),
by = .(as.integer(time), cycle(time) %in% 3:8)]