如何在scikit-learn的高斯过程回归中重新标定归一化标准差？

我使用scikit-learn进行高斯过程回归建模。我的数据没有标准化。模型总是返回0到1之间的标准差值，这与我的数据不符。有人知道我如何重新调整标准差值来获得实际的标准差吗?

我使用的一种方法是在scikit-learn中使用标准标量。在训练模型之前对数据集进行规范化是很自然的。

流程如下:

std_scaler

希望对大家有所帮助:)

好吧，赵斗铉的程序并不完全有效。考虑对于高斯过程，一些新的数据点X'的预测分布是正态分布的。假设我们有训练数据中目标Y的均值u和标准差s，我们在训练前使用它们进行标准化。然后我们可以用

对均值和方差进行逆变换

所以新的预测分布是Normal(E[Y']*s + u, s^2*Y')。

如果你需要一个具体的实现，你可以查看GPy的规范化器。

相关内容