基于内容与基于协作的过滤



基于内容的过滤(CBF(:它根据产品/项目属性工作。Say User_1过去已经为某些项目下订单(或喜欢(。现在,我们需要确定这些订购项目的相关功能,并将它们与其他项目进行比较,以推荐任何新项目。根据特征集找到类似项目的著名模型之一是随机森林或决策树

协作过滤(CLF(:它使用用户行为。Say User_1过去已经为某些项目下订单(或喜欢(。现在我们找到类似的用户。用户过去订购/喜欢相同项目的人可以认为是相似的用户。现在,我们可以根据分数推荐类似用户订购的一些项目。找到类似用户的著名模型之一是KNN

问题:说我必须在CBF中找到相似的用户(如我提到的(,而是基于某些用户配置文件,例如国籍/身高/体重/语言/薪金等将被视为CBF或CLF?

第二个相关的疑问是CBF或CLF对系统中的新用户不起作用,因为他在系统中没有进行任何活动。那是对的吗 ?相同的当我们在这里没有太多数据时,系统是新的还是启动的?

您可以将基于内容的方法视为回归问题,其中您将X_I作为数据点及其相应的Y_I作为用户给予的评级。您已经正确地说明了CLF,它使用了用户项目矩阵,从中创建项目项目或用户用户矩阵,然后根据这些矩阵推荐产品/项目。

但是,在基于内容的情况下,您需要构建与每个用户相对应的向量。例如假设我们要为Netflix用户创建向量。该矢量可以包含该功能,例如该用户看过的电影,他/她喜欢的电影的遗传,他是关键用户等。y_i将等级。这些推荐系统被称为基于内容,这回答了您的第一个问题。

来到您的第二个问题,其中新用户/项目进入图片时,如何向该用户推荐项目。这个问题称为冷启动问题。在这种情况下,您可以使用该用户的地理位置来选择他所在国家中人们观看的顶级物品并根据此建议。一旦他开始对这些顶级项目进行评分,那么您的CLF和内容通常都可以正常工作。

最新更新