r-用新数据评估线性模型,返回拟合值



我正在构建和评估我的模型,如下所示。

yData <- rnorm(10)
xData <- matrix(rnorm(20), 10, 2)
polyModel <- lm(yData~polym(xData, degree=2, raw=T))
newData <- matrix(rnorm(100), 50, 2)
yPredicted <- predict(polyModel, polym(newData, degree=2, raw=T))

然而,模型评估yPredicted恰好等于长度为10的向量的拟合值polyModel$fitted.values。在这种情况下,我期望yPredicted是长度为50的向量。如果能提供一些帮助,我们将不胜感激。

predict()不能很好地工作,除非在data参数中指定数据。这似乎有效:

polyModel <- lm(yData~poly(V1, V2, degree=2, raw=TRUE),
data=as.data.frame(xData))
length(fitted(polyModel))  ## 10
newData <- matrix(rnorm(100), 50, 2)
yPredicted <- predict(polyModel, newdata=as.data.frame(newData))
length(yPredicted) ## 50
  • V1V2是将矩阵转换为数据帧时指定的默认列名
  • 如果要在多项式中放入未知和/或大量列(例如poly(V1, ..., V1000, degree=2, raw=TRUE)(,则此规范不会很好地工作

如果你事先不知道列的数量,稍微的破解方案是:

f <- as.formula(sprintf("yData~poly(%s, degree=2, raw=TRUE)",
paste("V", seq(ncol(xData)), sep="", collapse=", "))
polyModel <- lm(f, data=as.frame(xData))

(未经测试(

最新更新