小贝子编程

sklearn.prreprocessing StandardScaler是否将数据转换为标准正态分布

本文关键字：转换标准正态分布数据 prreprocessing StandardScaler 是否 sklearn machine-learning scikit-learn data-preprocessing standardization
更新时间 : 2023-09-22
英文 : Does sklearn.preprocessing StandardScaler converts the data into standard normal distribution?

sklearn.preprocessing中的StandardScaler()声称生成mean=0和std=1。实际上，mean是一个非常小的数字，接近0，类似地，std接近1，但不相等。它真的像使用一样将数据转换为标准正态分布吗

z = (x - mu) / sigma

您可以在数据集中试用它，它具有不同的列，值具有不同的范围。使用StandardScaler进行缩放有助于数据的标准化，因为这样可以更好地计算几种基于距离的算法。

Z-Score总是将我们的特定列转换为平均值为0、标准差为1的缩放数据。

from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
model = scaler.fit(X_train)
y_test = model.predict(X_test)

注意：这里，我不是在y_train上应用StandardScaler，我们不应该在y数据上应用StandardScale。

相关内容