评估协作过滤



我的项目即将结束,我的公司要求我在没有指标的情况下评估模型。简而言之,在获得最佳的 10 个推荐之后,我应该看看这些推荐是否在新用户想看的电影之间。我不明白如果我在做和算法来预测这些电影,我该怎么做。

慢慢地,我找到了一条可能的下水道来回答我的问题。一位用户说,一种可能的方法是为每个用户随机隐藏几个数据点,使用你的算法提出建议,然后发现隐藏的数据,看看有多少数据与建议匹配。

但我仍然没有明确的想法。谁能帮我?

以下是进行评估的方法:

  1. 筛选评分超过 20 个且值为 5 的用户(确切数字将取决于您的数据集(;
  2. 每个用户随机选择两部电影;

这是我们的测试集 — 在训练期间不会使用它,但这些电影应该相应地出现在所选用户的最佳推荐中。

您可以在有关构建基于贝叶斯个性化排名的推荐系统的文章中找到更多详细信息和实际实现。

最新更新