通过具有多个分类特征的线性回归模型预测单个数据



我建立了一个线性回归模型来预测产品的销售数字,在我的情况下,我有5个特征,其中4个是分类的。

MONTH REGION INTERVENANT CONFIG WEIGHT SALES_NB

我使用OneHotEncoder

from sklearn.preprocessing import OneHotEncoder
onehotencoder = OneHotEncoder(categorical_features = [0,1,2,3])
X = onehotencoder.fit_transform(X).toarray()
X = X [:, 1:]

(如果我错了,请纠正我(

我想知道如何格式化数据以将其传递给predict((。事实上,如果我通过:

Xnew = np.array([[2,2,14895,614,0.1]])
ynew = regressor.predict(Xnew)

我得到了这个错误:

ValueError:形状(1,4(和(428,(未对齐:4(dim 1(!=428(调光0(

在将新样本传递给预测器之前,请尝试使用onehotencoder对其进行编码:

Xnew = np.array([[2,2,14895,614,0.1]])
Xnew_encoded = onehotencoder.transform(Xnew)
ynew = regressor.predict(Xnew_encoded)

最新更新