4阶和5阶多项式回归在Excel中不起作用



我在Excel中进行多项式回归时遇到了一个奇怪的问题。正如许多人以前所做的那样,我试图获得Excel在图形上创建多项式趋势线时使用的正确系数。我已经阅读了如何使用LINEST进行回归,并且在进行二阶和三阶回归时,我能够得到与趋势线公式匹配的答案。。。但当我尝试第4名或第5名时,答案与Excel在趋势线公式上显示的结果大相径庭。

以下是图表中的数据和我对五阶回归的尝试:点击Excel工作簿

有人知道是什么给我带来了麻烦吗?

谢谢!

-Jon

输出中的零值是(多重)共线的结果。来自MS功能帮助:

"…LINEST函数检查共线,并在识别时从回归模型中删除任何多余的X列。删除的X列在LINEST输出中可以识别为除了0 se值之外还有0个系数……">

为了获得更准确的估计,应用以平均值为中心的x值的LINEST,并乘以二项式系数矩阵。所以代替:

=LINEST(B2:B31,A2:A31^{1,2,3,4,5})

尝试:

=MMULT(LINEST(B2:B31,(A2:A31-AVERAGE(A2:A31))^{1,2,3,4,5}),IFERROR(COMBIN({5;4;3;2;1;0},{5,4,3,2,1,0})*(-AVERAGE(A2:A31))^({5;4;3;2;1;0}-{5,4,3,2,1,0}),0))

其与趋势线值一致。

另请参阅:https://newtonexcelbach.wordpress.com/2011/02/04/fitting-high-order-polynomials/(帖子和评论)

您可能拟合过度;事实上,如果你使用五阶多项式,我想说你可能是。多项式高于3阶(有时甚至高于1阶!),你就冒着"趋势线"在终点射入外太空的风险。当你超过了一定的复杂度时,你就是在让模型适应数据点的随机变化,而不是生成数据的底层机制。

避免这个问题的一种方法是使用像岭回归这样的正则化机制。Christopher Bishop的《模式识别与机器学习》一书对这一主题进行了出色的讨论,并给出了如何正则化多项式回归的一个很好的例子。

顺便说一句,我不会用Excel进行统计分析。以下是计算统计和数据分析杂志上一篇关于Excel统计功能的文章(我第一次在另一篇stackoverflow帖子上看到链接;但我不记得在哪里;很抱歉原始海报没有给予适当的赞扬):http://www.pages.drexel.edu/~bdm25/excel2007.pdf

最新更新