我正在使用 sklearn.metrics.confusion_matrix(y_actual, y_predict)
来提取TN,FP,FN,TP,并且大多数时候它可以完美地工作。
from sklearn.metrics import confusion_matrix
y_actual, y_predict = [1,1,1,1], [0,0,0,0]
tn, fp, fn, tp = confusion_matrix(y_actual, y_predict).ravel()
>>> [0 0 4 0] # ok
y_actual, y_predict = [1,1,1,1],[0,1,0,1]
tn, fp, fn, tp = confusion_matrix(y_actual, y_predict).ravel()
>>> [0 0 2 2] # ok
但是,在某些情况下,Confusion_matrix()并不总是返回这些信息,我将获得ValueError,如下所示。
from sklearn.metrics import confusion_matrix
y_actual, y_predict = [0,0,0,0],[0,0,0,0]
tn, fp, fn, tp = confusion_matrix(y_actual, y_predict).ravel()
>>> [4] # ValueError: not enough values to unpack (expected 4, got 1)
y_actual, y_predict = [1,1,1,1],[1,1,1,1]
tn, fp, fn, tp = confusion_matrix(y_actual, y_predict).ravel()
>>> [4] # ValueError: not enough values to unpack (expected 4, got 1)
我的临时解决方案是编写自己的功能来提取这些信息。有什么办法可以强迫 confusion_matrix()
始终返回TN,FP,FN,TP输出?
谢谢
此问题与输入矩阵中包含的唯一标签数量有关。在您的第二个示例中,它(正确地)分别使用一个类别为0或1的一个类别构建混淆矩阵。
即使未预测其中一个类别,也要强迫它输出两个类,请使用label
属性。
y_actual, y_predict = [0,0,0,0],[0,0,0,0]
tn, fp, fn, tp = confusion_matrix(y_actual, y_predict, labels=[0,1]).ravel()
>> array([[4, 0],
[0, 0]])