特征工程中的拟合和拟合变换有什么区别



我试图使用fit.transform来使用标准标量算法从sklearn库转换我的特征变量?特征工程中的拟合和拟合变换有什么区别?

  • fit仅计算均值&与数据的标准偏差,但不转换数据
  • fit_transform计算平均值&标准偏差,并同时转换数据

添加到@Muhammad Hamza的答案:

注意:答案写在类"StandardScaler(("的contaxt中,但相同的概念适用于所有其他sklearn类。

  1. 有什么区别
  • fit((只计算均值&与数据的标准偏差,但不转换数据。

  • transform((将标准标量(fit((计算的参数(应用于数据

  • fit_transform((计算平均值&标准偏差,并同时转换数据。因此,它是fit((和transform((的组合

  1. 何时使用fit((或fit_transform((
  • 对于训练数据集,我们需要应用一些转换(在您的情况下,是StandardScalar(((,我们更喜欢使用fit_transform(有时它比应用fit((,然后再应用transform((更快(

您可能还看到了使用fit((和transform((的代码。但请注意,fit((&变换用于训练数据

  • 对于验证或测试数据集,我们使用ONLY transform((,因为我们希望使用从训练集计算的参数(在您的情况下,是均值和sd(,然后在验证/测试集上应用转换

最新更新