我建立了一个线性回归模型来预测产品的销售数字,在我的情况下,我有5个特征,其中4个是分类的。
MONTH REGION INTERVENANT CONFIG WEIGHT SALES_NB
我使用OneHotEncoder
from sklearn.preprocessing import OneHotEncoder
onehotencoder = OneHotEncoder(categorical_features = [0,1,2,3])
X = onehotencoder.fit_transform(X).toarray()
X = X [:, 1:]
(如果我错了,请纠正我(
我想知道如何格式化数据以将其传递给predict((。事实上,如果我通过:
Xnew = np.array([[2,2,14895,614,0.1]])
ynew = regressor.predict(Xnew)
我得到了这个错误:
ValueError:形状(1,4(和(428,(未对齐:4(dim 1(!=428(调光0(
在将新样本传递给预测器之前,请尝试使用onehotencoder
对其进行编码:
Xnew = np.array([[2,2,14895,614,0.1]])
Xnew_encoded = onehotencoder.transform(Xnew)
ynew = regressor.predict(Xnew_encoded)