我正在构建和评估我的模型,如下所示。
yData <- rnorm(10)
xData <- matrix(rnorm(20), 10, 2)
polyModel <- lm(yData~polym(xData, degree=2, raw=T))
newData <- matrix(rnorm(100), 50, 2)
yPredicted <- predict(polyModel, polym(newData, degree=2, raw=T))
然而,模型评估yPredicted
恰好等于长度为10的向量的拟合值polyModel$fitted.values
。在这种情况下,我期望yPredicted
是长度为50的向量。如果能提供一些帮助,我们将不胜感激。
predict()
不能很好地工作,除非在data
参数中指定数据。这似乎有效:
polyModel <- lm(yData~poly(V1, V2, degree=2, raw=TRUE),
data=as.data.frame(xData))
length(fitted(polyModel)) ## 10
newData <- matrix(rnorm(100), 50, 2)
yPredicted <- predict(polyModel, newdata=as.data.frame(newData))
length(yPredicted) ## 50
V1
和V2
是将矩阵转换为数据帧时指定的默认列名- 如果要在多项式中放入未知和/或大量列(例如
poly(V1, ..., V1000, degree=2, raw=TRUE)
(,则此规范不会很好地工作
如果你事先不知道列的数量,稍微的破解方案是:
f <- as.formula(sprintf("yData~poly(%s, degree=2, raw=TRUE)",
paste("V", seq(ncol(xData)), sep="", collapse=", "))
polyModel <- lm(f, data=as.frame(xData))
(未经测试(