我正在尝试使用scikit-learn库中的SVC类来解决多类分类问题。我对一对一的策略感兴趣。我想优化每对类的超参数(C 和 gamma)。但我没有知道如何在scikit-learn中做到这一点。我该怎么做?谢谢。
如@ncfirth所述,您可以使用 GridSearchCV 根据您的训练集找到最佳参数。我在程序中使用了以下代码。
tuned_parameters = [{'kernel': ['rbf'], 'gamma': [1e-3, 1e-4, 1e-5, 1e-6, 1e-7, 1e-8],
'C': [1, 10, 100, 1000]}]
scores = ['precision', 'recall']
for score in scores:
print("# Tuning hyper-parameters for %s" % score)
print()
clf = GridSearchCV(svm.SVC(C=1), tuned_parameters, cv=5,
scoring='%s_macro' % score)
clf.fit(X, Y)
print("Best parameters set found on development set:")
print()
print(clf.best_params_)
我从stackoverflow获得了上述解决方案(没有指向它的链接),它帮助我在程序中选择了正确的伽玛和C值。我的要求是只检查"rbf"内核。您可以包括线性、多边形和其他内核及其参数,以检查您是否适合您的程序。