我需要实现的基本上是向量值的所有组合的列表,但运行给定长度的槽窗口。展示比解释更容易。
假设我有window.size
3
vector <- c("goofy", "mickey", "donald", "foo", "bar")
这是我需要的输出
from | to
------+-----
goofy | mickey
goofy | donald
mickey| donald
mickey| foo
donald| bar
donald| foo
foo | bar
由于这将以蒙特卡洛迭代集结束,因此windows.size
应该是参数化的
我认为使用 dplyr 和 tidyr 可以轻松完成,但我无法弄清楚如何完成。
提前感谢!
withrollapply
anddplyr
.需要c
、do.call
、as.data.frame
丑陋才能将combn
的输出转换为dplyr
函数的数据帧:
library(zoo)
library(dplyr)
rollapply(vector, 3, combn, 2, simplify = FALSE) %>%
c() %>%
do.call(rbind, .) %>%
as.data.frame() %>%
distinct() %>%
setNames(c("from", "to"))
结果:
from to
1 goofy mickey
2 mickey donald
3 donald foo
4 goofy donald
5 mickey foo
6 donald bar
7 foo bar
您可以使用索引逻辑和子集来制作可概括的形式:
data.frame(
from = vector[c(rep(1:3, each = 2), 4)],
to = vector[c(2, rep(3:5, each = 2))]
)
from to
1 goofy mickey
2 goofy donald
3 mickey donald
4 mickey foo
5 donald foo
6 donald bar
7 foo bar
其中原始vector
是:c("goofy", "mickey", "donald", "foo", "bar")
。
编辑
更可识别一点:
n <- length(vector)
data.frame(
from = vector[rep(1:(n-1), each = 2)[-2*n + 2]],
to = vector[rep(2:n, each = 2)[-1]]
)
您可以使用dplyr
包中的lead
。
library(dplyr)
## Example of n = 2
n = 2
res = data.frame()
for(i in 1:n){res = na.omit(rbind(res,cbind(v,lead(v,i))))}
names(res) = c("from","to")
res
from to
1 goofy mickey
2 mickey donald
3 donald foo
4 foo bar
5 goofy donald
6 mickey foo
7 donald bar
## Example of n = 4
n = 4
res = data.frame()
for(i in 1:n){res = na.omit(rbind(res,cbind(v,lead(v,i))))}
names(res) = c("from","to")
res
from to
1 goofy mickey
2 mickey donald
3 donald foo
4 foo bar
5 goofy donald
6 mickey foo
7 donald bar
8 goofy foo
9 mickey bar
10 goofy bar