我正试图使用GridSearchCV为XGB_Classifier找到一个最佳参数集。由于我的数据非常不平衡,拟合和评分(在cross_validation中)都必须使用权重进行,因此我必须使用自定义评分器,该评分器将"权重"向量作为参数。然而,我找不到让GridSearchCV将"权重"向量传递给记分员的方法。
曾有人尝试将此功能添加到网格搜索中:
https://github.com/ndawe/scikit-learn/commit/3da7fb708e67dd27d7ef26b40d29447b7dc565d7
但它们没有合并到master中,现在我担心这个代码与上游的更改不兼容。
有人遇到过类似的问题吗?有什么"简单"的方法可以解决吗?
您可以手动平衡训练数据集,如Scikit学习平衡子采样