我曾经见过这个函数,但现在不记得它的名字了。该函数执行输入向量/矩阵的滚动切片,并输出高 1 维的矩阵。以下是该函数的作用:
rolling_slice <- function(v,window){
rows = length(v)-window+1
m <- matrix(0,rows,window)
for(i in 1:rows){m[i,] <- v[i:(i+window-1)]}
return(m)
}
带有矢量输入的示例输出如下所示:
> v <- 1:10
> rolling_slice(v,3)
[,1] [,2] [,3]
[1,] 1 2 3
[2,] 2 3 4
[3,] 3 4 5
[4,] 4 5 6
[5,] 5 6 7
[6,] 6 7 8
[7,] 7 8 9
[8,] 8 9 10
尝试找到它的原因是我想加快 R 中的滚动窗口操作,我希望这个函数可以通过预先索引输入数据来提供帮助。
我刚刚发现了基本R
函数embed
,现在它是我最喜欢的事情之一:
> numcol <- 3
> embed(1:10, numcol)
[,1] [,2] [,3]
[1,] 3 2 1
[2,] 4 3 2
[3,] 5 4 3
[4,] 6 5 4
[5,] 7 6 5
[6,] 8 7 6
[7,] 9 8 7
[8,] 10 9 8
它基本上完全按照您的描述,通过制作数据的滚动窗口矩阵,第二个输入是窗口大小。 如果顺序很重要,您可以使用以下方法反转列:
embed(1:10, numcol)[ , numcol:1]
听起来zoo:rollapply/rapply()
或roll*()
是你需要的。您的实际最终应用是什么:滚动均值、中位数、加权和、滤波器、滚动标准开发、其他什么?我怀疑您的最终应用程序只是在滑动窗口切片。生成大量不必要的临时数据结构是没有意义的,因为它会扼杀内存和性能。
此外,就性能而言,这听起来像是data.table
的顺序访问将击败dplyr/tibbles/tidyverse的情况。您使用什么数据结构?
您可以在基本 R 中对此进行矢量化处理:
window <- 3
m <- diag(length(v)-window+1)
(row(m)+col(m)-1)[,1:window]
# [,1] [,2] [,3]
# [1,] 1 2 3
# [2,] 2 3 4
# [3,] 3 4 5
# [4,] 4 5 6
# [5,] 5 6 7
# [6,] 6 7 8
# [7,] 7 8 9
# [8,] 8 9 10