i在三个类别分类问题(三个随机森林)上使用OneVSrest分类器。每个类的出现被定义我的虚拟整数(1用于出现,否则为0)。我想知道是否有一种简单的替代方法来创建混乱矩阵?当我遇到的所有方法时,以y_pred,y_train = array,shape = [n_samples]的形式进行参数。理想情况下,我想要y_pred,y_train = array,shape = [n_samples,n_classes]
一些样本,类似于问题的结构:
y_train = np.array([(1,0,0), (1,0,0), (0,0,1), (1,0,0), (0,1,0)])
y_pred = np.array([(1,0,0), (0,1,0), (0,0,1), (0,1,0), (1,0,0)])
print(metrics.confusion_matrix(y_train, y_pred)
返回: 不支持多标记 - 指标
我不知道您有什么想法,因为您没有指定要寻找的输出,但是以下是您可以解决的两种方法:
1.一个混淆矩阵每列
In [1]:
for i in range(y_train.shape[1]):
print("Col {}".format(i))
print(metrics.confusion_matrix(y_train[:,i], y_pred[:,i]))
print("")
Out[1]:
Col 0
[[1 1]
[2 1]]
Col 1
[[2 2]
[1 0]]
Col 2
[[4 0]
[0 1]]
2.一个混乱矩阵
为此,我们要弄平数组:
In [2]: print(metrics.confusion_matrix(y_train.flatten(), y_pred.flatten()))
Out[2]:
[[7 3]
[3 2]]
您可以在下面尝试以一口气获取所有详细信息。
from sklearn.metrics import confusion_matrix
confusion_matrix(y_test.argmax(axis=1), y_pred.argmax(axis=1))
这将为您提供以下类似的东西:
array([[ 7, 0, 0, 0],
[ 0, 7, 0, 0],
[ 0, 1, 2, 4],
[ 0, 1, 0, 11]])
- 这意味着所有对角线都是正确预测的。