使用预定义分割的网格搜索的重新拟合属性



我正在使用GridseachCV来调整超参数。我分别有训练、验证数据。我正在遵循预定义的拆分方法来处理此问题(与此类似(:

ps = PredefinedSplit(test_fold=your_test_fold)

然后在GridSearchCV中设置cv=ps

如果我将 refit 参数设置为 true,在所有参数调整之后,我的模型是在整个数据上训练还是只在训练数据上训练?

从文档中:

改装:布尔值、字符串或可调用,默认值=真

使用在整个数据集上找到的最佳参数重新拟合估计器。

因此,是的,它将使用具有最佳超参数的整个数据集。无论您使用默认值(3 折 CV(还是来自 PredefinedSplit 的拆分都没有关系。

最新更新