是否可以使用map-reduce创建Apriori应用程序?我开始,但不清楚如何创建下一个候选人集基于以前的运行。有人有这方面的经验吗?
了解一下Apache Mahout可能会很有用。它是一个用Java编写的机器学习和数据挖掘框架,它将发送MapReduce任务抽象为集群、推荐和分类任务。
似乎apriori算法没有实现(有一个jira问题标记为不会修复:https://issues.apache.org/jira/browse/MAHOUT-108),但也许其他算法可能对你有用。
即使您只需要apriori算法,查看它们的源代码以获得一些想法也是有用的。