准备时间序列数据与机器学习的常规数据有什么区别



我不知道如何询问或搜索这个,任何关键词或概念都值得赞赏。如果可以详细说明这两种数据形式的性质差异将是很大的。

通常,您会考虑规范化或标准化数据。归一化是在 0-1 之间重新缩放数据,而标准化数据是将其重塑为正态分布。虽然后者对于新数据更可靠,但它需要先验知识,即您的数据遵循正态分布,这在许多情况下是不正确的。规范化要求您知道数据的最小值和最大值,但通常更适用于大多数情况。

对于时间序列数据,上述两种方法仍然适用,但您需要首先确保处理的是平稳数据。否则,模型从训练集中学习的"规模"可能不适用于推理。

时间序列数据还有另外两种方法:幂变换和差分变换。

幂变换用于消除变化的差异。对数变换、Box-Cox 变换和 Yeo-Johnson 变换是一些变体。

差异变换用于消除趋势或季节性。

相关内容

最新更新