我试图使用fit.transform来使用标准标量算法从sklearn库转换我的特征变量?特征工程中的拟合和拟合变换有什么区别?
- fit仅计算均值&与数据的标准偏差,但不转换数据
- fit_transform计算平均值&标准偏差,并同时转换数据
添加到@Muhammad Hamza的答案:
注意:答案写在类"StandardScaler(("的contaxt中,但相同的概念适用于所有其他sklearn类。
- 有什么区别
-
fit((只计算均值&与数据的标准偏差,但不转换数据。
-
transform((将标准标量(fit((计算的参数(应用于数据
-
fit_transform((计算平均值&标准偏差,并同时转换数据。因此,它是fit((和transform((的组合
- 何时使用fit((或fit_transform((
- 对于训练数据集,我们需要应用一些转换(在您的情况下,是StandardScalar(((,我们更喜欢使用fit_transform(有时它比应用fit((,然后再应用transform((更快(
您可能还看到了使用fit((和transform((的代码。但请注意,fit((&变换用于训练数据
- 对于验证或测试数据集,我们使用ONLY transform((,因为我们希望使用从训练集计算的参数(在您的情况下,是均值和sd(,然后在验证/测试集上应用转换