算法:寻找'Favorite Color'分拣机的想法



我已经为这个问题困惑了一段时间,似乎找不到一个好的解决方案。我很想听听人们的想法(或者如果有人知道现有的解决方案)让我描述一下这个问题。

最终目标是在运行我们的算法并对结果进行排序后,在数据集中找到整体"最喜欢的颜色"。

假设我们允许用户对他们喜欢的颜色进行投票。例如,我们有蓝色、红色、绿色和黄色。我们让用户不根据他们的总体喜好进行投票,而是从两种颜色中选出他们最喜欢的颜色。(例如,红色覆盖蓝色)

随着时间的推移,我们的数据可能是这样的:(括号中的数字是该颜色的票数)

  • 红色(7)vs蓝色(2)
  • 红色(6)vs绿色(3)
  • 红色(3)与黄色(4)
  • 蓝色(3)vs绿色(5)
  • 蓝色(4)与黄色(4)
  • 绿色(1)与黄色(5)

我假设我们需要为每个配对分配一个"置信度"分数,描述我们对结果正确性的确定程度。(如果我们100%确定,可能是0,如果我们100%肯定,可能是1)我想我们必须考虑每对的总票数。例如,只有1票的配对,因此100%的置信度得分需要"降低"。

不管怎样,如果有人有什么想法,我很乐意听听。

干杯,感谢阅读。

您想要的是一种从成对比较中找到排名的方法。ELO可能是一个良好的开端。中的不同设置也有人问这个问题

如何使用众包分类对一百万张图像进行排名

基于配对比较的排名

最新更新