在python scikit-learn中的多标签朴素贝叶斯中指定先验



我正在研究多标签分类。我在python scikit-learn上使用GaussianNB函数。目标是具有 (N, L( 形状的数组,其中 L 是类数,N 是观测值数。

我使用了三种方法来处理多标签案例:

  1. 二进制相关性
  2. 链条模型
  3. 标签电源组

我有一个 L 类的先验分布,它是一个 (L,( 形状的数组。我试图通过这样的先验参数将此先验分布合并到高斯NB中

classifier = BinaryRelevance(GaussianNB(priors = prior_dist))

但是,它返回以下错误

ValueErrors: number of priors must match number of classes

在多标签案例中将先验指定到高斯NB的正确方法是什么?

我还没有在scikit-multilearn中添加对此的支持,但添加起来似乎相当容易 - 你能把它作为scikit-multilearn中的一个功能请求吗?我想我知道如何添加它,但我们可以在 github 中进一步跟踪问题。

最新更新