我试图弄清楚我使用的代码是计算精度还是准确性,或者两者兼而有之。由于我只有一点统计学背景(另一种语言),我并不真正理解维基百科文章](https://en.wikipedia.org/wiki/Accuracy_and_precision)涵盖该主题。
具体来说,我使用以下Python代码:
from sklearn import svm, cross_validation
clf = svm.SVC(kernel=kernel, C=C)
scores = cross_validation.cross_val_score(clf, FeatureMatrix, np.squeeze(LabelMatrix), cv=d_inds)
scikit-learn函数的文档可以在这里找到:
-
sklearn.svm.SVC
-
sklearn.cross_validation.cross_val_score
默认情况下,cross_val_score
使用分类器的score
方法(通常这是准确性)。如果要指定另一个指标,请在 scoring
参数中传递它,如 cross_val_score(clf, X, y, scoring = 'precision')
.有关评分选项的完整列表,请查看 http://scikit-learn.org/stable/modules/model_evaluation.html