为一个旨在对流数据进行预测的模型标准化训练数据是否现实?



我正在尝试使用卷积神经网络基于非流数据预测活动(例如跑步,坐着,走路)。与不进行标准化或规范化相比,对训练和测试数据进行标准化或规范化可以显著提高网络的预测性能。到目前为止,一切顺利。

然而,我想让我的方法也适用于流数据。但是,从理论上讲,我无法想象标准化或规范化流数据是可行的。因为,为了标准化,你需要知道均值和标准差,它们会随着每一个新输入的数据点而改变。对于规范化,您需要知道数据的最小值和最大值,这也可能随着每个新传入的数据点而改变。在这种情况下,对训练数据进行标准化或规范化甚至没有意义,因为这意味着为训练数据和未见数据创建不同的分布。

我不太确定我是否错过了什么。但是对于流数据是否有一个解决方案,以便可以应用标准化或规范化?

失踪的是几乎每一个模型你将训练你的训练分布是恒定的。如果您的数据不断变化,那么您必须不断更新/重新训练您的模型,因此您必须重新配置归一化器的事实实际上并不重要。与拟合任何ML模型相比,mean/std的估计具有超低的样本复杂性,所以如果你的模型不发散,你的归一化器也不会发散。

最新更新