潜在缺陷-在AAB测试中Firebase不合理的结果



我正在进行AAB测试,这意味着测试中有两个对照组,以确保种群分布正确。结果告诉我,复制的对照组比原始组显示出积极的结果。

我在两个应用程序上重复了多次测试,但原始组和重复的对照组之间的结果仍然不同。

这有什么可能的原因吗?

相同对照组之间的一些百分比的在线现场实验将显示统计上的赢家。这被称为假阳性。Firebase支持涵盖了此主题。

不同的统计框架有不同的管理错误率(和假阳性率(的方法,例如:

Leanpullum

优化

如果您多次遇到假阳性,从统计数据来看,这是不可能的,通常指向实现错误或软件错误。

免责声明:我在Optimizely工作。

相关内容

  • 没有找到相关文章

最新更新