用于时间序列预测的测试集



以下链接中的示例具有来自时序数据的训练和验证集。没有提到测试集。为什么没有一个,对于实时生成时间序列数据的数据集来说

,需要一个需要什么?我以 3 秒的间隔收集了 1 小时的数据。我想在它可用之前预测接下来的 30 分钟。训练/验证/测试拆分应该是什么样的?可以跳过测试集吗?

https://www.tensorflow.org/tutorials/structured_data/time_series

从不建议跳过测试集。在 TensorFlow 示例中,目的是演示如何使用时间序列;您可以像在验证一样在"测试集"上进行测试,但约束是测试集是完全未知的:这里我们来回答您的第二个问题。

关于测试集,在您的用例中,就像您所说的那样,测试集是动态生成的数据。

当然,您可以将初始数据集拆分为训练/价值/测试。但是,显然与您的模型"实时部署"一致的第二个测试集是在"动态生成的数据集"上进行预测=>这意味着您将实时将数据馈送到模型中。

训练-val-test 拆分取决于您希望如何创建模型:您想要使用多少时间步长(在预测下一步等时要考虑多少秒,您尝试预测多少变量,您想要预测提前多少时间步长(在您的情况下,30 分钟将是 30*60 = 1800, 因为您的数据集信号频率以秒为单位(。这是一个非常广泛的问题,更多地涉及如何为多步骤预测的时间序列分析创建数据集。

最新更新