我正在尝试学习一些机器学习,想知道什么是数据的二次和三次变换,它是如何实现的?论坛上有一个人在谈论它,我想知道变量的转换是什么,以及它是如何实现的。感谢
多项式特征(二次、三次等)用于减少模型中的偏差,并允许项之间的相互作用。在scikit learn中,它被实现为sklearn.preprrocessing.PolynomialFeatures.中的转换
这个想法是,如果您有三个特性a
、b
和c
。二次特征将通过扩展CCD_ 4来生成。因此,a^2
、b^2
、c^2
、a*b
、a*c
、b*c
将是二次特征的集合。
在scikit learn的PolynomialFeatures
中,当参数degree
被传递时,所有达到该程度的术语都会被创建。
这通常在构建线性模型之前使用。它允许较低的偏差,但它非常迅速地增加了特征集的大小。