小贝子编程

组合多个二进制分类器(LinearSVC)进行多标签分类

本文关键字：分类标签二进制分类器组合 LinearSVC python scikit-learn svm text-classification multilabel-classification
更新时间 : 2023-09-19
英文 : Combining Multiple Binary Classifiers (LinearSVC) for Multilabel Classification

我有一个包含6个类的数据集，这些类可以映射到4个热编码列，这样每个类都对应于一个热编码的不同组合：

>one-hot1<1th>one-hot3<2th>one-hot4<1><1>0<1><1>1<1>0<1>

要严格回答您的问题：您可以简单地连接预测的布尔值并解码完整的一个热向量。然后，您可以根据真实类来评估预测的类。

然而，这不太可能很好地工作，除非你有一些专业知识证明类应该以这种方式划分(例如，如果类之间有一些层次排序(。

一般来说，类标签不必是一个热编码的，而不是分类特征。标签的分类性质可以安全地表示为数值，通常使用LabelEncoder。简言之：这是因为模型没有也不能使用标签的数字顺序，而在用数字表示的分类特征的情况下，它会错误地依赖于顺序。

相关内容