我有大约1000个时间序列。每个时间序列都是一个api延迟的记录,我想检测所有时间序列的异常。我应该创建一个for循环来为每个api(每个时间序列(训练一个模型(LSTM自动编码器(吗?或者有没有一种方法可以拟合一个可以检测所有时间序列异常的模型?
您的问题的答案是"这取决于";。
重要的是你要了解每一种方法的含义。
我应该为每个时间序列创建一个for循环来训练模型(LSTM自动编码器(吗?
在这种情况下,这意味着您的模型将从每个API的每个时间序列中依次学习。如果您试图检测的异常和延迟模式在不同的API中是一致的,那么这可以很好地工作。这只是让您的模型在包含所有时间序列的数据集上迭代的一种不同方式。
如果没有这样的一致性,并且每个API显示不同的延迟模式和异常,那么顺序学习就没有意义了。想象一下,试图通过对模型进行温度训练来预测天气,然后再对风速进行再训练。。。最有可能的是,你的模型不会有任何好处,因为它不会在这样的环境中了解这两个因素之间的相互作用。
或者有没有一种方法可以拟合一个模型,从而检测所有模型的异常时间序列?
有,您可以将问题结构化为具有1000个功能的数据集(每个API 1个(。如果时间序列没有以相同的频率采样,则可能会出现困难,您可能必须对其重新采样。但在这种情况下,您可以开发一个模型来监控所有一千个API。
当然,这是理论上的,因为对于1000个特征,你可能需要大量的样本来避免";维度诅咒";。