python中线性回归分类器的输入批处理



我想在python中创建线性回归算法的同时,使用3年窗口来批量输入2000-2020年的数据,看看这3年对第四年的数据意味着什么。

输入数据示例:[20002012002],[200120022003],[200220032004]

输出数据:[2003]、[2004][2005]

我希望我的分类器能够解析2000-2020年的整个数据集,并将线性回归作为一个整体进行拟合。

我没有一个";到目前为止,我已经做到了";多年来,我一直在思考for循环的示例代码,但如果我理解正确的话,我的reg.fit(x,y(命令每次在循环中都会重置拟合,最终我的拟合将成为[201720182019]的输入,而[2020]是覆盖之前所有拟合的输出。

我假设目标是预测类似您的示例的东西,即您有3个数据点作为输入:

  • X1:从N-4年到N-2年的滑动窗口上的值v
  • X2:从N-3年到N-1年的滑动窗口上的值v
  • X3:从N-2年到N年的滑动窗口上的值v

并且您希望预测从N-1年到N+1年的下一个滑动窗口中代表v的Y。

在ML设计中,此选项意味着您有三个特性,即线性回归模型的三个输入维度。换句话说,单个实例由(X1,X2,X3,Y(组成。通常,训练集由多个这样的实例组成,因此可以基于训练集中的所有实例来训练单个模型。

该选项的优点是,该模型将考虑3年v对下一年v的影响随年份的变化。然而,该模型只能预测下一年,而在单个维度X上训练的模型可能预测任何一年。

最新更新