r语言 - 使用qr的简单线性方程.解出很不准确的结果



我正试图找出如何解决线性方程组的近似值(即有误差的解决方案,我希望它最小化)。

为了理解/验证这个过程,我想出了一个简单的例子:我给出了一堆5x + 4x^2 + 3x^3,答案误差为0-5%。

> a
       [,1]  [,2]    [,3]
  [1,]    1     1       1
  [2,]    2     4       8
  [3,]    3     9      27
[...]
 [98,]   98  9604  941192
 [99,]   99  9801  970299
[100,]  100 10000 1000000
> b
  [1]      12.04      48.17     130.02     269.93     505.75     838.44
  [7]    1202.04    1911.69    2590.51    3381.00    4538.80    5846.19
...
 [97] 2824722.45 2826700.98 3012558.52 2920400.25

当我尝试用qr来解决这个问题时。解决,

> qr.solve(a,b)
[1] 85.2896286 -0.8924785  3.0482766

的结果是完全关闭(想要5,4,3)。我肯定我错过了一些明显的东西。或者也许我的多项式实验本身就很糟糕?(如果是,为什么?)

我无法用附加错误重现此问题:

a <- cbind(1:100, (1:100)^2, (1:100)^3)
set.seed(42)
b <- a %*% (5:3) + rnorm(100, sd = 0.1)
qr.solve(a, b)
#         [,1]
#[1,] 4.998209
#[2,] 4.000056
#[3,] 3.000000

我可以用一个相对误差来复制它,但这并不奇怪,因为这个误差是由第三次求和的大小决定的:

a <- cbind(1:100, (1:100)^2, (1:100)^3)
set.seed(42)
b <- a %*% (5:3) * rnorm(100, mean = 1, sd = 0.1)
qr.solve(a, b)
#             [,1]
#[1,] -1686.611970
#[2,]    68.693368
#[3,]     2.481742

请注意,第三个系数与您的期望有关(在不可复制的示例中更是如此)。

最新更新