假设我有一系列的100天1、2、。。。,100和时间步长3。如果我没有第101、102和103天的真实数据,我应该如何创建验证集来预测未来3天?训练集是[t-3,t-2,t-1],其中t=[3100],如下所示:
X Y
1 2 3 4
2 3 4 5
...
97 98 99 100
我认为每次预测都要迭代地将预测值添加到数据中:
iter=1
X Y_pred
98 99 100 101
iter=2
X Y_pred
99 100 101 102
iter=3
X Y_pred
100 101 102 103
这样做有效吗?或者有更好的解决方案吗?
非常感谢。
如果我没有第101、102和103天的真实数据,我应该如何创建验证集来预测未来三天?
在您的情况下,损失、均方误差或其他类似损失是通过使用真实标签和预测标签来计算的。用一个替代另一个是不正确的。这适用于培训和评估。
因此,唯一的选择是在时间步长97之后丢弃标签。如果你有一个小的数据集,并且喜欢尽量减少标签的丢弃,你可以掩盖为缺乏真正标签的时间步长计算的损失。例如,在时间步骤99中,可以使用步骤100的损失,但必须忽略步骤101和102的损失。