如果评论数量之间存在巨大差异，则处理正面评级的算法

我们有两个产品P1和P2。P1 共有 1000 条评论，P2 共有 200 条评论。

P1的正面评价是85%(85%的用户说这是一款好产品( P2的正面评价是90%(90%的用户说这是一个好产品(

现在，如果我们看到技术上P1比P2更好，因为850个用户说这是一个好产品，而只有180个用户说P2很好。

如何解决这个问题，以便我们可以显示公平的结果？如果可能，请分享逻辑或算法。

查看维基百科上的置信区间(链接(。

基本上，您将以 95% 的准确度(或您想要的水平(计算实际值在平均值的 +/- x 之间。这取决于数据点的数量，因此更多的评论将为您提供更短的间隔。

你用它做什么取决于你。你可以悲观地显示区间的下限，同时95%+确定它比这更好。

如果要比较两者，您可以查看区间之间的重叠，并得出结论，如果重叠度很高，则它们大致相同。

由于这个东西来自统计，保证假设分布的某些属性，即在这种情况下，P1 和 P2 的判断相似。虽然并不总是正确的，但置信区间往往是有用的。

相关内容