二进制向量作为roc_curve的y_score参数



sklearn roc_curve docstring 指出:

"y_score:数组,形状 = [n_samples]目标分数可以是正类的概率估计、置信度值或二元决策。

在什么情况下,将y_score设置为二进制向量("二进制决策")是有意义的?这难道不会导致一个带有一个点的 ROC 曲线,这有点违背了这个点吗?

如果您使用的是不输出概率分数的分类器(例如 svm.SVC没有明确的probability=True),没有办法计算 ROC 曲线。作为 API 设计人员,您有两种选择:引发异常并且不向用户提供任何有用信息,或者使用一个数据点绘制退化曲线。我认为后者更有用。

相关内容

  • 没有找到相关文章

最新更新