r语言 - 交叉生产滚动值



我正在尝试找出一种基于数据向量计算滚动总和值的方法。下面是一个示例数据帧和我正在尝试计算的答案,但无法找出正确的解决方案。从本质上讲,我正在尝试将每个 x 列值乘以 y 向量并根据周期求和。

period= c(1,2,3)
x=c(1,1,1)
y= c(2,3,4)
df=data.frame(period,x,y)
This is how I solved the answer.
2+0+0
3+2+0
4+3+2
0+4+3
0+0+4
answer= c(2,5,9,7,4)

我已经查看了 slam 包以及交叉生产功能,但无济于事。

提前感谢!

如果目的是计算 3 个值的滚动总和,以便隐式添加 0 以确保输出有 5 个元素,即使输入有 3 个元素,请尝试以下方法:

1) 滚动应用 乘以xy并插入 0,具体取决于是使用右对齐、居中对齐还是左对齐以及是否使用partial=align="center"rollapply 的默认值,align = "right"rollapplyr 的默认值。

library(zoo)
rollapply(c(0, x*y, 0), 3, sum, partial = TRUE)
## [1] 2 5 9 7 4
rollapplyr(c(x*y, 0, 0), 3, sum, partial = TRUE)
## [1] 2 5 9 7 4
rollapplyr(c(0, 0, x*y), 3, sum, align = "left", partial = TRUE)
## [1] 2 5 9 7 4
rollapply(c(0, 0, x*y, 0, 0), 3, sum)
## [1] 2 5 9 7 4
rollsum(c(0, 0, x*y, 0, 0), 3) #  this solution has the lowest character count
## [1] 2 5 9 7 4

2) 基本 R 可以使用embed编写基本解决方案:

rowSums(embed(c(0, 0, x*y, 0, 0), 3))
## [1] 2 5 9 7 4

2a) 或取累积总和并减去累计总和 3:

cumsum(c(x*y,0,0)) - cumsum(c(0, 0, 0, (x*y)[-3]))
## [1] 2 5 9 7 4

2b) 如果想法是要进行循环计算,那么:

c(filter(c(0, x*y, 0), c(1,1,1), circular = TRUE))
## [1] 2 5 9 7 4

我们可能会使用

c(cumsum(df$y), rev(cumsum(rev(df$y)))[-1])
# [1] 2 5 9 7 4

cumsum(df$y)给出从一端开始的累积总和,然后rev(cumsum(rev(df$y))给出从另一端开始的累积总和,我们[-1],因为全和重合:

cumsum(df$y)
# [1] 2 5 9
rev(cumsum(rev(df$y)))
# [1] 9 7 4

如果有人想按组进行类似的计算,下面的代码应该可以工作。

df_nest<-df%>% group_by(variable)%>%nest()
df_nest%>%
  mutate(NewColumn = map(data, ~rollapplyr(c(.$x*.$y, 0, 0), 3, sum, partial = TRUE)))%>%
  unnest()

相关内容

  • 没有找到相关文章

最新更新