我是机器学习的新手,因此,我试图弄清楚我的数据集是否足以运行LSTM模型。我正在尝试对每日道路交通数据进行时间序列预测。目前,我有20个不同地点的每日数据(2012-2019年(。基本上,每个位置我只有大约2800个数据点。这是一个好的数据集吗?
关于如何调整数据或转换数据以帮助我的数据集,有什么建议吗?
请帮忙!非常感谢。
考虑一下,您的数据集大约有2800*20个示例。现在,您总是可以在这么多数据上运行LSTM/RNN模型,但您应该尝试检查它们是否优于Autoregressive Moving Average (ARMA)
等基线模型,CCD_ 2。
此外,如果数据的格式为:
Example_1: Day_1: x, Day_2:y, ...., Day_n: xx .etc
而不是输入整个Day_1 ... Day_n
特征来预测Day_n+1
您总是可以通过使用Day_1
来预测Day_2
来增加数据集,依此类推
检查此链接。我做了一些可能会有所帮助的事情。