如何组合两个机器学习算法输出



如果我有两个非常不同的数据集和两种非常不同的分类技术,有没有一个好的方法来组合这两种输出?我知道平均值可能有效,但有更相关的方法吗?我听说过几个概念,比如助推和整体学习,这些适用吗?

解决这个问题有两种通用方法。第一种称为boosting,使用加权投票来决定预测。其主要思想是将两种分类器的优点结合起来。

第二种方法称为堆叠,使用两个分类器的输出作为另一个分类器的特征(可能具有其他特征,例如原始特征),并使用最终分类器的输出进行预测。

在没有更多细节的情况下,这是我能给出的最好答案。

有关更多信息,请参阅Stats.SE上机器学习中的Bagging、boosting和stacking。

最新更新