r-应用滚动函数,生成数据帧列表(或单个rbounded数据帧)



滚动函数(据我所知(最常用的两个函数是zoo::rollapplydata.table::frollapply()

然而,两者似乎都无法运行为每个步骤生成数据帧的函数,然后将其返回到列表中或作为单个rbind数据帧。

作为一个琐碎的例子,如果我有一个函数,它只是返回一个琐碎数据帧,并且我用滚动函数调用它,我希望得到:

f <- function(x) {
data.frame(a = LETTERS[x], b = x)
}
# will be called twice, with inputs 1:2 and 2:3.
myrollapply(1:3, n = 2, FUN = f)
#> [[1]]
#>   a b
#> 1 A 1
#> 2 B 2
#>
#> [[2]]
#>   a b
#> 1 B 2
#> 2 C 3
#>
#> -- OR --
#> 
#>   a b
#> 1 A 1
#> 2 B 2
#> 3 B 2
#> 4 C 3

(对于那些感兴趣的人来说,我真正的use-case滚动通过一个日期向量(或列表,如果必要的话(,然后调用一个返回表格数据的外部API。由于API的限制,我不能一次完成所有工作,必须多次调用API才能获得所需内容。我的最终目标是将我从API获得的所有数据帧整理成一个单独的rbind数据帧。(

对于zoodata.table:来说,这似乎是不可能的

zoo似乎不允许列表作为zoo对象,这阻碍了它们作为输入或输出的使用。如果函数返回一个裸露的data.frame,那么输出似乎是单个data.frames的转置版本的rbind(此外,输出是一个矩阵,而不是data.frame,这是不可接受的(。

zoo::rollapply(c(1, 2, 3),
width = 2,
FUN = function(x) {data.frame(a = 1:3)})
#>      a1 a2 a3
#> [1,]  1  2  3
#> [2,]  1  2  3
zoo::rollapply(data.frame(a = c(1, 2, 3)),
width = 2,
FUN = function(x) {data.frame(a = 1:3)})
#>      a
#> [1,] 1
#> [2,] 1
#> [3,] 2
#> [4,] 2
#> [5,] 3
#> [6,] 3
zoo::rollapply(c(1, 2, 3),
width = 2,
FUN = function(x) {list(data.frame(a = 1:3))})
#> Error in zoo(do.call("c", dat), index(data)[ix], attr(data, "frequency")) : 
#>   “x” : attempt to define invalid zoo object
zoo::rollapply(list(1, 2, 3),
width = 2,
FUN = function(x) {data.frame(a = 1:3)})
#> Error in zoo(data) : “x” : attempt to define invalid zoo object

使用data.table::frollapply,问题更容易理解:返回值必须是数字(或可转换为数字(。

data.table::frollapply(c(1, 2, 3), n = 2, FUN = function(x) {data.frame(a = 1:3)})
#> Error in data.table::frollapply(c(1, 2, 3), n = 2, FUN = function(x) { : 
#>   frollapply: results from provided FUN are not of type double

有没有一个包或方法可以处理这种特殊情况?我目前正在用for循环手工完成,但我怀疑可能有一个更好、更像R的解决方案。

1(对索引运行rollapply,然后使用apply

library(zoo)
f <- function(x) data.frame(a = LETTERS[x], b = x)
ii <- rollapply(1:3, 2, c)
apply(ii, 1, f)

给予:

[[1]]
a b
1 A 1
2 B 2
[[2]]
a b
1 B 2
2 C 3

2(这也适用:

L <- list()
junk <- rollapply(1:3, 2, function(x, i = x[1]) L[[i]] <<- f(x))
L

给予:

[[1]]
a b
1 A 1
2 B 2
[[2]]
a b
1 B 2
2 C 3

3(另一种方法是根据语言进行计算。

s <- rollapply(1:3, 2, function(x) sprintf("f(c(%s))", toString(x)))
lapply(s, function(x) eval(parse(text = x)))

给予:

[[1]]
a b
1 A 1
2 B 2
[[2]]
a b
1 B 2
2 C 3

救援序列:

## window and number
w <- 2
n <- 2
## generate sequence
s <- rep(seq_len(w)) + rep(seq.int(0, n-1), each=w)
f(s)
#  a b
#1 A 1
#2 B 2
#3 B 2
#4 C 3

一个简单的滚动切片函数:(

roll_slice <- function(x, w, s){
#' w: window size
#' s: step size
embed(x, w)[seq(1, length(x) - w + 1, by = s), rev(seq_len(w))]
}
apply(roll_slice(c(1, 2, 3), 2, 1), 1, f)
# [[1]]
#   a b
# 1 A 1
# 2 B 2
# 
# [[2]]
#   a b
# 1 B 2
# 2 C 3

您可以使用lapply:应用自己的滚动函数

val <- 1:3
k <- 2
lapply(seq_along(head(val, -(k-1))), function(x) f(val[x:(x+k-1)]))
# [[1]]
#  a b
#1 A 1
#2 B 2
#[[2]]
#  a b
#1 B 2
#2 C 3

另一个例子-

val <- 1:5
k <- 3
lapply(seq_along(head(val, -(k-1))), function(x) f(val[x:(x+k-1)]))
# [[1]]
#  a b
#1 A 1
#2 B 2
#3 C 3
#[[2]]
#  a b
#1 B 2
#2 C 3
#3 D 4
#[[3]]
#  a b
#1 C 3
#2 D 4
#3 E 5

最新更新