R 函数以滚动方式对向量/矩阵进行切片



我曾经见过这个函数,但现在不记得它的名字了。该函数执行输入向量/矩阵的滚动切片,并输出高 1 维的矩阵。以下是该函数的作用:

rolling_slice <- function(v,window){
  rows = length(v)-window+1
  m <- matrix(0,rows,window)
  for(i in 1:rows){m[i,] <- v[i:(i+window-1)]}
  return(m)
}

带有矢量输入的示例输出如下所示:

> v <- 1:10
> rolling_slice(v,3)
     [,1] [,2] [,3]
[1,]    1    2    3
[2,]    2    3    4
[3,]    3    4    5
[4,]    4    5    6
[5,]    5    6    7
[6,]    6    7    8
[7,]    7    8    9
[8,]    8    9   10

尝试找到它的原因是我想加快 R 中的滚动窗口操作,我希望这个函数可以通过预先索引输入数据来提供帮助。

我刚刚发现了基本R函数embed,现在它是我最喜欢的事情之一:

> numcol <- 3
> embed(1:10, numcol)
     [,1] [,2] [,3]
[1,]    3    2    1
[2,]    4    3    2
[3,]    5    4    3
[4,]    6    5    4
[5,]    7    6    5
[6,]    8    7    6
[7,]    9    8    7
[8,]   10    9    8

它基本上完全按照您的描述,通过制作数据的滚动窗口矩阵,第二个输入是窗口大小。 如果顺序很重要,您可以使用以下方法反转列:

embed(1:10, numcol)[ , numcol:1]

听起来zoo:rollapply/rapply()roll*()是你需要的。您的实际最终应用是什么:滚动均值、中位数、加权和、滤波器、滚动标准开发、其他什么?我怀疑您的最终应用程序只是在滑动窗口切片。生成大量不必要的临时数据结构是没有意义的,因为它会扼杀内存和性能。

此外,就性能而言,这听起来像是data.table的顺序访问将击败dplyr/tibbles/tidyverse的情况。您使用什么数据结构?

您可以在基本 R 中对此进行矢量化处理:

window <- 3
m <- diag(length(v)-window+1)
(row(m)+col(m)-1)[,1:window]
    # [,1] [,2] [,3]
# [1,]    1    2    3
# [2,]    2    3    4
# [3,]    3    4    5
# [4,]    4    5    6
# [5,]    5    6    7
# [6,]    6    7    8
# [7,]    7    8    9
# [8,]    8    9   10

最新更新