机器学习 - 是基于项目还是基于内容的协同筛选



我目前正在开发一个现有系统,该系统推荐与用户喜欢的先前项目相似的项目。

它使用交替最小二乘协同过滤来查找用户和项目的特征向量。然后,它使用项目的特征向量,并使用余弦相似性度量来查找与其相似的项目。

但是,我想澄清一下这是基于项目的 CF 还是基于内容的过滤?我的倾向是两者兼而有之。既然是使用相似性度量来比较项目,但项目在特征向量的内容上?

谢谢

如果我正确理解您从类似用户的项目数据中提取项目的特征向量,那么它是纯粹的基于项目的 CF。

为了进行基于内容的过滤,应

使用项目本身的功能:例如,如果项目是电影,则基于内容的过滤应利用电影长度或其导演等功能,而不是基于其他用户偏好的功能。

我想你的倾向是对的,你正在结合内容和协同过滤。如果您使用的是基于内容的,那么项目和用户的向量可以称为数据x_i(如数据点),而A_ij输入数组中的单元格,说明用户对项目 j 的评级可以称为y_i。您正在使用余弦相似性来查找项目-项目和用户-用户之间的相似性。我想在你的场景中,你应该去协作。

尝试制作项目-项目矩阵,然后计算余弦相似性。

相关内容

  • 没有找到相关文章

最新更新