不同来源的多数据时间序列预测



我有一个关于时间序列预测的有趣问题。如果有人有来自多个传感器的时间数据,每个数据集都会有数据,例如,从2010年到2015年,所以如果一个人要使用来自这些不同传感器的所有数据来训练一个预测模型,那么数据应该如何组织?因为如果只是将数据集堆叠起来,它会生成,例如,sensorDataset1 (2010-2015), sensorDataset2(2010-2015),并且循环将从传感器3,4和n开始。这是时间序列数据的问题吗?如果是,如何正确处理?

我尝试使用所有的数据堆叠和训练模型,实际上它有一个很好的错误,但我想知道这种方法是否真的有效。

尝试对同一时间段的单个传感器数据集进行采样。

例如,传感器1每5分钟输入一次数据,传感器2每10分钟输入一次数据。尝试对所有传感器的数据采样到一个共同的周期。您向模型显示的每个数据点都将具有更好的质量数据,这将影响模型的性能。

影响你的误差的方面取决于你试图预测的内容和数据中存在的关系,这些关系显示了变量之间的关系。

最新更新