我知道缩放意味着居中(平均= 0)和使单位方差(方差= 1)。
但是,scikit-learn中的preprocessing.scale(x)
和preprocessing.StandardScalar()
有什么区别?
那些做完全相同的人,但是:
-
preprocessing.scale(x)
只是一个函数,它会转换一些数据 -
preprocessing.StandardScaler()
是支持变压器API
的类
即使我不需要inverse_transform
和CO,我也会始终使用后者。由StandardScaler()
。
摘自文档:
功能量表提供了一种在单个数组的数据集上执行此操作的快速简便方法
预处理模块进一步提供了一个实用类标准器,该标准器实现变压器API以计算训练集上的平均值和标准偏差,以便稍后能够在测试集上重新申请相同的变换。因此,此类适合在Sklearn.pipeline.pipeline的早期步骤中使用
我的理解是,量表将在数据的最小数据范围内转换数据,而标准标准将在[-1,1]的范围内转换数据。