有人可以解释一下各种scikit-learn性能指标中的sample_weight参数是什么,例如:
- 准确度得分 (https://scikit-learn.org/stable/modules/generated/sklearn.metrics.accuracy_score.html(
- Jaccard_score (https://scikit-learn.org/stable/modules/generated/sklearn.metrics.jaccard_score.html#sklearn.metrics.jaccard_score(
- F1 得分 (https://scikit-learn.org/stable/modules/generated/sklearn.metrics.f1_score.html( 等。
非常感谢。
它只是指示每个 smaple 对指标的影响程度。请看这个例子:
如果y_true
和y_pred
以下,accuracy_score
将0.6666666
:
y_true = [0, 0, 1]
y_pred = [0, 1, 1]
accuracy_score(y_true, y_pred) # 0.6666666666666666
但是,如果第二个样本对我们来说比其他两个样本更重要,我们可以用sample_weight
来强制执行它的重要性:
accuracy_score(y_true, y_pred, sample_weight=[1, 2, 1]) # 0.5