ROC曲线数据点的计算(接收器操作员特性)



给定一个特定的阈值e,我能够生成两组以下格式:-

Set<String> observedDocs;
Set<String> actualDocs;

现在我要提出真阳性率和假阳性率。TPR很容易计算,它是一个非常直观的召回定义,我以以下方式进行了定义:-

private double recall(final Set<String> observedDocs, final Set<String> actualDocs) {
    Set<String> relevantAndRetrieved = new HashSet<>(observedDocs);
    relevantAndRetrieved.addAll(actualDocs);
    return relevantAndRetrieved.size() / actualLabels.size();
}

我需要一些等价的基于集合操作的方法来计算假阳性率。我不想计算假阳性、假阴性计数等。

好吧,FPR是被分类器标记为阳性的阴性示例的比例。但我不知道如何用变量来表达。您的recall函数是如何工作的?observedLabelsactualLabels最多有2个元素,对吧?你是不是想把Set改成List??

最新更新