我有一个有两个标签的数据集,我知道这两个标签之间有很强的相关性。然而,当我使用不考虑相关性的scikit多学习二进制相关性时,我得到的结果与考虑这些标签相关性的Labelpowerset分类器非常相似?对此有何评论?除了我用http://scikit-multilearn.github.io/我不知道它有多有效??
我是scikit multilean的作者。为了回答你的问题,我需要看看标签组合的图表。两个标签产生4个组合,但如果组合[1,0]和[0,1]在[0,0]或[1,1]的情况下占主导地位,那么您可能会遇到标签Powerset无法正确学习相关情况的基本分类器的问题。它还取决于您使用哪种衡量标准来验证性能?