我使用'RandomizedSearchCV'
函数来估计随机森林模型的最佳参数。我可以使用'best_estimator_'
属性来预测我的测试数据吗?
我的问题是,在进行随机搜索时,部分数据将用于验证。因此,最佳估计RF模型不会在整个数据集rt上进行训练?还是一切都在幕后处理?
如文档中所述,cv.best_estimator_
返回搜索所选的估计器,即给出最高分数的估计员。
如果参数refit
设置为True(默认值(,则将使用整个数据集上的最佳参数(包括验证(重新调整模型。因此,您可以简单地使用cv.best_estimator_
来预测您的测试数据。