给定一个特定的阈值e,我能够生成两组以下格式:-
Set<String> observedDocs;
Set<String> actualDocs;
现在我要提出真阳性率和假阳性率。TPR很容易计算,它是一个非常直观的召回定义,我以以下方式进行了定义:-
private double recall(final Set<String> observedDocs, final Set<String> actualDocs) {
Set<String> relevantAndRetrieved = new HashSet<>(observedDocs);
relevantAndRetrieved.addAll(actualDocs);
return relevantAndRetrieved.size() / actualLabels.size();
}
我需要一些等价的基于集合操作的方法来计算假阳性率。我不想计算假阳性、假阴性计数等。
好吧,FPR是被分类器标记为阳性的阴性示例的比例。但我不知道如何用变量来表达。您的recall
函数是如何工作的?observedLabels
和actualLabels
最多有2个元素,对吧?你是不是想把Set
改成List
??