小贝子编程

如何组合两个机器学习算法输出

如果我有两个非常不同的数据集和两种非常不同的分类技术，有没有一个好的方法来组合这两种输出？我知道平均值可能有效，但有更相关的方法吗？我听说过几个概念，比如助推和整体学习，这些适用吗？

解决这个问题有两种通用方法。第一种称为boosting，使用加权投票来决定预测。其主要思想是将两种分类器的优点结合起来。

第二种方法称为堆叠，使用两个分类器的输出作为另一个分类器的特征（可能具有其他特征，例如原始特征），并使用最终分类器的输出进行预测。

在没有更多细节的情况下，这是我能给出的最好答案。

有关更多信息，请参阅Stats.SE上机器学习中的Bagging、boosting和stacking。

相关内容