RF、PCA和CV生成错误的管道



我正在拟合一个随机森林回归模型,使用管道PCA和网格搜索进行超参数选择,但不知何故,它给了我一个错误。以下是我的代码:

params_rf = {'RandomForestRegressor__n_estimators': [300, 400, 500],
'RandomForestRegressor__max_depth': [4, 6, 8],
'RandomForestRegressor__min_samples_leaf': [0.1, 0.2],
'RandomForestRegressor__max_features': ['log2', 'sqrt']}
pipe = Pipeline([('scaler', StandardScaler()),
('reducer', PCA(n_components=50)),
('regressor',RandomForestRegressor(verbose = 3))])
rf_cv = GridSearchCV(estimator = pipe,
param_grid = params_rf,
cv =3,
verbose=3)
rf_cv.fit(X_train,y_train)

错误消息:

Invalid parameter RandomForestRegressor_max_depth for estimator Pipeline(steps=[('scaler', StandardScaler()), ('reducer', PCA(n_components=50)),
('regressor', RandomForestRegressor(verbose=3))]). Check the list of available parameters with `estimator.get_params().keys()`.

我已尝试删除"RandomForestProgsor_"前缀,但问题仍然存在。我很确定max_depth实际上是RandomForestRegressor中的一个超参数

RandomForestRegressor,正如您的管道中使用的,已经有了一个名称regressor;你应该用这个名字来称呼它,而不是RandomForestRegressor。将params_rf更改为:

params_rf = {'regressor__n_estimators': [300, 400, 500],
'regressor__max_depth': [4, 6, 8],
'regressor__min_samples_leaf': [0.1, 0.2],
'regressor__max_features': ['log2', 'sqrt']}

最新更新