能告诉我在对 2 种变体进行谷歌内容实验时需要什么样的流量/样本量才能获得具有统计意义的结果?
谷歌使用多臂老虎机测试。这是一篇关于这个谷歌答案的好文章
在实践中,最好的方法是观察Google分析实验标签中的百分比,看看它向95%移动的速度有多快。
您无法获得确切的答案,因为它会随着您进行测量并根据您尝试测量的差异而变化。因此,如果一个变体的表现比另一个好 300%,那么与一个变体仅比另一个表现好 10% 相比,样本量要小得多。
在这里了解直接统计显著性的数学是如何工作的,这是一个很好的解释。统计显著性教程
这是一个地方,它有一个计算器
就多臂强盗的数学而言,彼得·惠特尔的这句话总结了它
[强盗问题]是在[第二次世界大战]期间提出的,解决它的努力消耗了盟军分析家的精力和思想,以至于有人建议将这个问题交给德国,作为智力破坏的终极工具。