我已经找到了人们如何使用Sklearn对Python进行线性回归,并使用其数据进行reg.fit()
,但这只有在您寻找像像回归的回归时可以这样做 y = Ax1 + Bx2 +Cx3
等
但是,如果我拥有具有某种交互的分类数据,以便我希望变量乘以乘以而不是添加?诸如y = (Ax1)*(Bx2)*(Cx3)
要照顾X1,X2和X3等输入特征之间的相互作用,常见的做法是创建X1^3,x1^2*x2 x1*等多项式特征x2*x3 ... x3^3。例如,在您的情况下,Y方程式看起来如下:
y = A*x1^3 + B*x2^3 + C*x3^3 + D*x1^2*x2 + E*x1*x2*x3 + F*x1*x2^2 + ...
我希望你明白这个主意。为了照顾分类数据,有一些技术,例如一式式编码,可以为您的数据提供非常简单的向量表示。Scikit Learn具有单速编码的实现
如果您想将学习提升到一个新的水平,也可以研究培训算法,例如支持向量机和神经网络