如果我有一个矩阵,如
x<-matrix(rnorm(30), nrow=5, ncol=6)
x
[,1] [,2] [,3] [,4] [,5] [,6]
[1,] -2.6564554 -0.1719174 -1.7631631 1.0351035 -0.85090759 0.7581632
[2,] -2.4404669 1.2146747 0.4600974 -0.6089264 -2.41420765 -0.7267048
[3,] 1.3201133 1.8951935 -0.6399949 0.5049551 0.03612261 -1.3682810
[4,] -0.3066386 -0.4304691 0.4554501 -1.7170087 0.20599860 0.4328180
[5,] -1.7813084 -0.2572694 0.7048373 -0.7844590 -0.36105730 -0.8113932
我想生成一个矩阵Y,它包含每行3个数据点的每组的斜率,所以我的新矩阵的元素Y[1,1]
和Y[1,2]
将是这样的:
Y[1,1]=lm(x[1,1:3]~c(1,2,3))$coefficient[2]
Y[1,2]=lm(x[1,2:4]~c(1,2,3))$coefficient[2]
我知道如何用for来做到这一点,这对于小数据来说是可以的,但是在超过一百万行的数据集上这样做几乎是不可能的。我与apply()
函数的问题是,我知道如何将函数应用于数据集的每一行,列或单个元素,但不是3个元素的集合。希望我说得清楚。由于
有一个zoo
的rollapply
函数,似乎做你想做的。
library(zoo)
rr <- t(rollapply(t(x), by.column=TRUE, width=3,
FUN=function(z) coef(lm(z ~ c(1,2,3)))[2]))
这里好像有一个额外的转置,但是我不知道怎么去掉它
我在每行上创建了一个循环函数来计算每组三个元素的系数。
mylm = function (x) {
v=vector("numeric", length(x)-2)
for (i in 1:(length(x)-2)) {
v[i]=lm(x[i:(i+2)]~c(1,2,3))$coefficient[2]
}
v
}
Y = t(apply(x, 1, FUN=mylm))
Y
[,1] [,2] [,3] [,4]
[1,] 0.2655043 -0.3789681 0.2305446 -0.8279703
[2,] -0.1925491 -0.4061229 0.3647903 -0.1093176