我是根据训练数据选择ARIMA参数,还是根据整个数据选择ARIMA参数?



我有时间序列数据,我想建立一个ARIMA预测模型。我把我的数据分成了train-test。我将只在训练集上训练模型,并在测试集上评估。

所以我的问题是,当我绘制ACF和PACF以获得适当的p和q参数时,我应该在我的训练集中还是在整个数据上绘制ACF和PACF ?关于Auto Arima,我应该输入整个数据还是只输入训练集?

我对训练数据和整个数据都进行了尝试。它们给出了不同的结果(对于ACF - PACF图和Auto ARIMA图)。那么我应该使用哪些数据呢?

将数据集划分为训练集和测试集的目的是模拟真实世界的场景,在这些场景中,您可以在历史数据上训练模型,并在未知的未来数据上评估其性能。虽然它只是为了为ARIMA选择参数而不是训练本身,但我们可以说,只使用训练数据集来与现实世界的场景保持一致是更正确的。

最新更新