如何知道在线性回归、多线性回归、多项式回归中需要特征缩放?因为在某些地方,我得到了一个点,即不需要特征缩放,因为系数在那里,而在某些地方我得到了特征缩放,所以实际答案是什么。
这两个语句都是正确但不完整的。
如果使用简单的线性模型(如y = w1 * x1 + w2 * x2
(,则不需要进行特征缩放。由于系数CCD_ 2和CCD_。
但是,如果使用正则化项修改上述表达式或定义变量的约束,则在没有特征缩放的情况下,系数将偏向幅度较大的特征。
结论:Feature scaling is important when we modify the expression for simple linear model
。此外,在应用任何算法之前对特征进行规范化也是一种很好的做法。
假设我们有重量和价格两个特性,如下表所示。"权重"不能与"价格"进行有意义的比较。因此,假设算法会这样做,因为"权重">"价格",因此"重量"比"价格"更重要。链接
当数据列的范围变化较大时,需要进行特征缩放。获得每列数据的min
、max
和mean
是的好方法
绘制数据是下一步。这很容易识别数据的不同维度的范围。