我读到sklearn中的内置集成方法使用决策树作为基本分类器。是否可以改用自定义分类器?
如果您指的是随机森林类,那么不,这目前是不可能的。去年一月,scikit-learn邮件列表中讨论了允许其他估算器的选项,但我认为没有任何实际的代码出现在该讨论中。
如果你使用 sklearn.ensemble.AdaBoostClassifier
,那么答案是肯定的:scikit-learn.org/stable/modules/generated/sklearn.ensemble.AdaBoostClassifier.html您可以自己分配base_estimator。
它是否有帮助,但是您可以使用管道实用程序非常轻松地堆叠/组合自定义分类器:http://scikit-learn.org/stable/tutorial/statistical_inference/putting_together.html#pipelining