具有可变数量输出的Python Scikit决策树



我希望使用Python SciKit库设置多输出决策树。然而,我面临的问题是,它不是一个简单的"n_outputs"分类。一些样本有3个输出,一些有4个,一些有5个。我不确定向图书馆传达这个信息的最佳方式是什么。

我正在考虑使用最大输出数量并具有"无输出"分类。因此,如果我训练一个集,其中每个样本被强制为5个输出,任何最初只有3个分类的样本将通过添加"无输出"分类而更改为5。

你觉得这样行吗?有没有其他的方法来做一个多输出决策树与可变数量的输出?

听起来您正在尝试进行多标签分类,而不是多输出分类。多标签可以很容易地通过提供一个指示向量来完成,该指示向量表示每个样本和每个类是否在类中,所以你得到一个大小为(n_samples, n_classes)的二进制数组(0表示不在类中,1表示在类中)。

查看多标签文档,看看它是否适合您的用例。

相关内容

  • 没有找到相关文章

最新更新