ValueError:数据不是二进制的,并且没有指定pos_label



我正在尝试计算roc_auc_score,但出现以下错误。

"ValueError: Data is not binary and pos_label is not specified"

我的代码片段如下:

import numpy as np
from sklearn.metrics import roc_auc_score
y_scores=np.array([ 0.63, 0.53, 0.36, 0.02, 0.70 ,1 , 0.48, 0.46, 0.57])
y_true=np.array(['0', '1', '0', '0', '1', '1', '1', '1', '1'])
roc_auc_score(y_true, y_scores)

请告诉我它出了什么问题。

您只需要更改y_true,使其看起来像这样:

y_true=np.array([0, 1, 0, 0, 1, 1, 1, 1, 1])

解释:如果您了解roc_auc_score函数在中的作用https://github.com/scikit-learn/scikit-learn/blob/0.15.X/sklearn/metrics/metrics.py您将看到y_true的评估如下:

classes = np.unique(y_true)
if (pos_label is None and not (np.all(classes == [0, 1]) or
 np.all(classes == [-1, 1]) or
 np.all(classes == [0]) or
 np.all(classes == [-1]) or
 np.all(classes == [1]))):
    raise ValueError("Data is not binary and pos_label is not specified")

在执行时,pos_labelNone,但只要您将y_true定义为字符数组,则np.all始终是false,并且由于所有字符都被否定,则if条件是true,并引发异常。

我们在y_true=np.array(['0', '1', '0', '0', '1', '1', '1', '1', '1'])将y_true的值转换为布尔

y_true= '1' <= y_true
print(y_true) # [False  True False False  True  True  True  True  True]

相关内容

  • 没有找到相关文章

最新更新