我应该使用哪种统计分布模型来确定样本总体均值为 0.5 的可能性(置信度为 95%)?



为了提供更多细节,我正在尝试对用户可以喜欢或不喜欢评论的网页上的评论进行排名。我特别想排名最高,用户分歧最大的评论。这意味着喜欢/不喜欢的比率应尽可能接近 0.5。我知道我的喜欢/不喜欢功能是伯努利参数的一种形式。我还希望评论 A(50 个喜欢/51 个不喜欢)的排名高于评论 B(1 个喜欢/1 个不喜欢),这意味着我需要合并一个 Wilson 置信区间。不过,我对我的统计数据有点生疏,所以我不记得将这一切放在一起的公式。

谁能帮我?

完全披露:我是一名生物统计学家,在这些事情上没有太多经验。 如果有常用的技术或约定,我可能没有听说过。

话虽如此,在我看来,传统的频率主义统计数据并不能很好地回答这个问题。 假设检验通常寻找参数不等于某个值的证据强度,越来越多的数据通常为不等式提供更多的证明权重。 像你描述的那样的置信区间方法更好(你可以根据区间的宽度给出权重) - 但是当 0.5 不在区间内时该怎么做并不是很明显。 注意:有几种方法可以为二项式p参数构建置信区间,并且没有真正的"错误"方法。

这里有一个稍微临时的解决方案,实际上可能运行良好(并且有一些贝叶斯基础):改用 Beta 发行版。 Beta由两个参数(a和b)定义,概率密度定义为

f(y)=((a+b-1)!/((a-1)!(b-1)!)(y^(a-1))((1-y)^(b-1))

它是在区间 (0,1) 上定义的,通常看起来像 a/(a+b) 处的概率质量凸起。 您可以将ab视为两个决斗参数,试图在任一方向上拉动凸起。 有趣的是,随着ab变大,凸起变得越来越高,即使比例相同,凸起也会变得更瘦。

如果您有 R,请尝试绘制

curve(dbeta(x,10,10))
curve(dbeta(x,5,5), add=T, col="red")
curve(dbeta(x,2,2), add=T, col="blue")

因此,使用a的"是"票数和b的"否"票数,然后您可以考虑描述基础p参数概率分布的结果 Beta 分布。 在数学上,这相当于贝叶斯 Beta-二项式模型,先验为 Beta(0,0)。

对于加权,您可以积分由 0.45 到 0.55(或更窄或更宽)之间的区域定义的概率质量......或者更简单的是,您甚至可以在 y=0.5 时使用曲线的高度!

同样,在 R 中,使用曲线高度的想法...

### some trial weights
dbeta(0.5, 1, 1)  # one yes, one no
# 1
dbeta(0.5, 2, 2)  # 2 yes, 2 no
# 1.5
dbeta(0.5, 4, 6)  # 4 yes, 6 no
# 1.96875
dbeta(0.5, 3, 7)  # 3 yes, 7 no
# 0.984375
dbeta(0.5, 49, 51)  # 49 yes, 51 no
# 7.799745

这取决于你,但对我来说似乎相当可行。

最新更新