Matlab、Mathematica 或 R 中的最佳多元多项式拟合



我有一个数据集(x,y),其中x是n维向量,y是m维向量。(m=3, n>2)我的目标是在 x 中找到拟合 (x,y) 数据集的最佳多项式。

x 的尺寸非常大(现在是 25),我不想手动输入所有可能性(即 x1*x3*x5、x1*x4*x6 等)。我可以使用Matlab,Mathematica和R。我该怎么做?

另外,我很想听听您对以下问题的建议:如何从结果中选择最相关的系数?(也许 x1*x2 比 x2*x3 更相关)

谢谢

这个问题实际上与任何分析平台无关,而是如何正确进行多变量分析。因此,应通过对主题领域的描述来补充它。还需要适当考虑正在发生的隐式多重测试,以及应该执行什么样的惩罚以避免推论统计的膨胀。底线:你应该阅读弗兰克·哈雷尔(Frank Harrell)的"回归建模策略"(Regression Modeling Strategies),其中每个句子都被扩展成一个完整的章节。(我也认为这个问题过于宽泛,应该关闭或迁移到stats.stackexchange。它还没有准备好用于黄金时段编码。

除了 DWin 的回答:

关于多项式,您可以通过范德蒙德矩阵上的线性回归来表示,然后使用多元线性回归。但是,对于许多变体,您可能会发现您宁愿需要限制模型,也不愿允许进一步的自由度。

另外,我很想听听您对以下问题的建议:如何从结果中选择最相关的系数?(也许 x1*x2 比 x2*x3 更相关)

这归结为变量选择,这是一个众所周知的难题。我认为埃夫隆将其命名为未解决的重大问题之一......

最新更新