我正在研究多标签分类。我在python scikit-learn上使用GaussianNB函数。目标是具有 (N, L( 形状的数组,其中 L 是类数,N 是观测值数。
我使用了三种方法来处理多标签案例:
- 二进制相关性
- 链条模型
- 标签电源组
我有一个 L 类的先验分布,它是一个 (L,( 形状的数组。我试图通过这样的先验参数将此先验分布合并到高斯NB中
classifier = BinaryRelevance(GaussianNB(priors = prior_dist))
但是,它返回以下错误
ValueErrors: number of priors must match number of classes
在多标签案例中将先验指定到高斯NB的正确方法是什么?
我还没有在scikit-multilearn中添加对此的支持,但添加起来似乎相当容易 - 你能把它作为scikit-multilearn中的一个功能请求吗?我想我知道如何添加它,但我们可以在 github 中进一步跟踪问题。