我正在寻找一个"合理"复杂度的Python在线学习/增量学习算法。
在Scikit-learn中,我发现了一些partial_fit
方法的算法,即['BernoulliNB', 'GaussianNB', 'MiniBatchKMeans', 'MultinomialNB', 'PassiveAggressiveClassifier', PassiveAggressiveRegressor', 'Perceptron', 'SGDClassifier', 'SGDRegressor']
在我看来,所有这些算法都形成了简单的决策边界。我们在Python中是否有现成的在线算法,可以对更复杂的决策边界进行建模?
更正:如下所述,K-means当然没有简单的决策边界。我要找的是有监督的算法,例如,异或。
一种一般的方法是将线性分类器与一些核逼近技术相结合,例如:
- 基于
- sgd的SVM/Logistic回归
- Nystroem
- RBFSampler/随机厨房水槽
只是建立一个管道,你仍然能够使用partial_fit
。
还有一点备注(关于你的算法列表):KMeans或KNearestNeighbor不会形成线性决策边界!