mahout是实时工作还是根据算法规则对数据进行预处理?



我正在尝试构建一个推荐引擎,因为我正在考虑使用apache mahout,但我无法确定mahout是否实时处理数据,或者在服务器空闲时预处理数据并将结果存储在数据库中的某个地方。

还有谁知道像亚马逊、netflix这样的网站采用的是什么方法?

非此即彼,不可兼而有之。里面有一个老项目的部分,基本上是实时的中等规模。还有一些基于Hadoop的实现都是离线的。这两者没有关系。

我是这些部分的主要创造者,如果你想要一个系统,两者都在一起,我建议你看看我目前的项目Myrrix (http://myrrix.com)

最新更新