大规模推荐



我正在处理一个推荐问题,涉及300万用户和50万个产品。推荐的目的是在访问给定产品时向特定用户推荐5-10个以上的产品。

我们完成了实时推荐引擎部分,但是我们发现在1-2秒内推荐并不是那么容易。我们考虑两种策略:

  1. 以批处理模式离线运行推荐,然后将结果存储在MySQL DB中。然而,表中的条目数量似乎是一个巨大的数字。每个用户对于每种产品应储存至少5-10个推荐产品。如果我创建一个以user和product作为表属性的表,将会有300万x 50万个条目。

  2. 动态预测推荐。我们刚试过,但是响应时间太长了。

关于这个问题,谁能给我一些建议?

为每个user-product-pair创建推荐产品列表对我来说很奇怪。通常情况下,对于类似您的用例的每个产品,您只有一个类似产品的列表。

最新更新