我有一个多元线性回归模型:
model <- lm(y ~ a + b + c, data = df)
假设y、a,b和c的历史时期是2000-2017年的季度数据。
Date y a b c
2000Q1 2 1.5 1.3 8.1
2000Q2 2.3 1.8 1.2 7.6
. . . . .
. . . . .
. . . . .
. . . . .
2017Q4 8.7 3.5 5.6 3.2
现在我有了我的线性模型,我想通过使用2017-2020年期间的a、b和c的新数据来预测y,我们将其称为a22以及c2。
Date a2 b2 c2
2017Q4 3.5 5.6 3.2
2018Q1 4.1 6.3 3.0
. . . .
. . . .
. . . .
2020Q4 5.6 7.8 2.2
如何使用我以前的一组历史/实际数据(a、b和c(中的线性模型,并根据较新的x值(a2,b2以及c2?
我尝试过使用predict((和predict.lm((函数,但是没有得到我想要的结果。我可以手动输入线性模型并创建这些预测,但我相信有更有效的方法可以做到这一点。
使现代化下面是我正在做的一个小例子:
df <- data.frame(y = c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10),
a = c(2, 2.3, 2.6, 2.9, 2.4, 2.6, 3.0, 3.2, 3.9, 3.7),
b = c(9, 8.7, 9.1, 7.8, 8.2, 8, 6.9, 7.8, 9.1, 5.7))
attach(df)
model <- lm(y ~ a + b)
df2 <- data.frame(a2 = c(3.7, 4.0, 5.2, 5.6, 5.8, 6),
b2 = c(5.7, 5.5, 5.3, 5.1, 4.9, 4.7))
predict(model, newdata = df2)
我不断得到常规模型的结果,并附上警告信息:
1 2 3 4 5 6 7 8
9 10
1.409122 2.807886 3.690647 5.826560 3.569001 4.501510 6.882534
7.004180 8.793667 10.514892
Warning message:
'newdata' had 6 rows but variables found have 10 rows
更新以匹配添加的示例
新数据中的名称必须与旧数据/线性模型中的名称匹配。
使用更新后的示例,在运行predict之前,使df2中的名称与df中的名称匹配。
names(df2) = c("a","b")
predict(model, newdata = df2)