置信区间/召回或精度的边缘



如果我具有基于样本集的混淆矩阵,我如何确定我的召回/precision/etctrics的统计能力(置信度/间隔)?我知道如何进行转换本身的概率进行统计能力分析,但是我该如何为召回/精度进行操作?

找到了答案。这是P /- Z_SCORE_AT_ALPHA * STD_ERROR的标准置信区间计算的一个稍微修改的方程。唯一的区别是,P(基本上是您的召回概率)是通过偏移 -> awaded_recall =(TP 2)/(TP FN 4)计算的。

一般的想法是,当p在0或1时,标准置信区间方程不起作用。此方程提供了使其工作的调整。它只是一个软糖因素。

此外,现在的std错误现在为sqrt(awaded_recall(1-adjusted_recall)/(n 4))。这被称为威尔逊分数间隔 - https://en.wikipedia.org/wiki/binomial_proptortion_confidence_interval#wilson_score_interval

http://www.stat.ucdavis.edu/~kwwong/sta13-ss1-12/statistics_13_files/lecture05.pdf

https://stats.stackexchange.com/questions/109429/wilsons-wilsons-andjustment-for-sample-propfort

最新更新