置信区间/召回或精度的边缘

如果我具有基于样本集的混淆矩阵，我如何确定我的召回/precision/etctrics的统计能力（置信度/间隔）？我知道如何进行转换本身的概率进行统计能力分析，但是我该如何为召回/精度进行操作？

找到了答案。这是P /- Z_SCORE_AT_ALPHA * STD_ERROR的标准置信区间计算的一个稍微修改的方程。唯一的区别是，P（基本上是您的召回概率）是通过偏移 -> awaded_recall =（TP 2）/（TP FN 4）计算的。

一般的想法是，当p在0或1时，标准置信区间方程不起作用。此方程提供了使其工作的调整。它只是一个软糖因素。

此外，现在的std错误现在为sqrt（awaded_recall（1-adjusted_recall）/（n 4））。这被称为威尔逊分数间隔 - https://en.wikipedia.org/wiki/binomial_proptortion_confidence_interval#wilson_score_interval

http://www.stat.ucdavis.edu/~kwwong/sta13-ss1-12/statistics_13_files/lecture05.pdf

https://stats.stackexchange.com/questions/109429/wilsons-wilsons-andjustment-for-sample-propfort

相关内容

最新更新

热门标签：