我正试图找出如何解决线性方程组的近似值(即有误差的解决方案,我希望它最小化)。
为了理解/验证这个过程,我想出了一个简单的例子:我给出了一堆5x + 4x^2 + 3x^3,答案误差为0-5%。
> a
[,1] [,2] [,3]
[1,] 1 1 1
[2,] 2 4 8
[3,] 3 9 27
[...]
[98,] 98 9604 941192
[99,] 99 9801 970299
[100,] 100 10000 1000000
> b
[1] 12.04 48.17 130.02 269.93 505.75 838.44
[7] 1202.04 1911.69 2590.51 3381.00 4538.80 5846.19
...
[97] 2824722.45 2826700.98 3012558.52 2920400.25
当我尝试用qr来解决这个问题时。解决,
> qr.solve(a,b)
[1] 85.2896286 -0.8924785 3.0482766
的结果是完全关闭(想要5,4,3)。我肯定我错过了一些明显的东西。或者也许我的多项式实验本身就很糟糕?(如果是,为什么?)
我无法用附加错误重现此问题:
a <- cbind(1:100, (1:100)^2, (1:100)^3)
set.seed(42)
b <- a %*% (5:3) + rnorm(100, sd = 0.1)
qr.solve(a, b)
# [,1]
#[1,] 4.998209
#[2,] 4.000056
#[3,] 3.000000
我可以用一个相对误差来复制它,但这并不奇怪,因为这个误差是由第三次求和的大小决定的:
a <- cbind(1:100, (1:100)^2, (1:100)^3)
set.seed(42)
b <- a %*% (5:3) * rnorm(100, mean = 1, sd = 0.1)
qr.solve(a, b)
# [,1]
#[1,] -1686.611970
#[2,] 68.693368
#[3,] 2.481742
请注意,第三个系数与您的期望有关(在不可复制的示例中更是如此)。