如果评论数量之间存在巨大差异,则处理正面评级的算法



我们有两个产品P1和P2。P1 共有 1000 条评论,P2 共有 200 条评论。

P1的正面评价是85%(85%的用户说这是一款好产品( P2的正面评价是90%(90%的用户说这是一个好产品(

现在,如果我们看到技术上P1比P2更好,因为850个用户说这是一个好产品,而只有180个用户说P2很好。

如何解决这个问题,以便我们可以显示公平的结果? 如果可能,请分享逻辑或算法。

查看维基百科上的置信区间(链接(。

基本上,您将以 95% 的准确度(或您想要的水平(计算实际值在平均值的 +/- x 之间。这取决于数据点的数量,因此更多的评论将为您提供更短的间隔。

你用它做什么取决于你。你可以悲观地显示区间的下限,同时95%+确定它比这更好。

如果要比较两者,您可以查看区间之间的重叠,并得出结论,如果重叠度很高,则它们大致相同。

由于这个东西来自统计,保证假设分布的某些属性,即在这种情况下,P1 和 P2 的判断相似。虽然并不总是正确的,但置信区间往往是有用的。

最新更新