在运行GridSearchCV时,我正在尝试了解CV_Validation_scores的输出。该文档无法充分解释这一点。
当我打印grid_search.grid_scores_
时,我会得到一个带有项目的列表,例如:
[mean: 0.60000, std: 0.18002, params: {'tfidf__binary': True, tfidf__ngram_range': (1, 1)....
这很有意义。但是,当我尝试解开GRID_SCORES的每个实例时,我会得到:
[0] same dictionary as above, makes sense
[1] score for all folds, makes sense
[2] a list that I don't understand, that looks like, "[ 0.75 0.33333333 0.66666667]"
这里报告了什么分数?
正如我在邮件列表上发布的那样,该文档非常清楚:
grid_scores_:命名元组列表
包含param_grid中所有参数组合的得分。每个条目对应于一个参数设置。每个命名元组都有以下属性:
parameters, a dict of parameter settings mean_validation_score, the mean score over the cross-validation folds cv_validation_scores, the list of scores for each fold
这些是交叉验证中每倍的分数。
i取消订阅和重新订阅。似乎现在可以工作