sklearn.prreprocessing StandardScaler是否将数据转换为标准正态分布



sklearn.preprocessing中的StandardScaler()声称生成mean=0std=1。实际上,mean是一个非常小的数字,接近0,类似地,std接近1,但不相等。它真的像使用一样将数据转换为标准正态分布吗

z = (x - mu) / sigma

您可以在数据集中试用它,它具有不同的列,值具有不同的范围。使用StandardScaler进行缩放有助于数据的标准化,因为这样可以更好地计算几种基于距离的算法。

Z-Score总是将我们的特定列转换为平均值为0、标准差为1的缩放数据。

from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
model = scaler.fit(X_train)
y_test = model.predict(X_test)

注意:这里,我不是在y_train上应用StandardScaler,我们不应该在y数据上应用StandardScale。

最新更新