我刚开始使用Hadoop,我需要使用它来计算一个非常大的数据集的关联规则。我无法理解如何使用R Hadoop和MapReduce从数据集中查找关联规则。我有交易矩阵,但是我需要做什么才能用这个带有hadoop的矩阵执行先验算法?这是用于执行先验(包规则)的命令
rules <- apriori(incidence.matrix , parameter = list(minlen=2, supp=0.09, conf=0.95))
我需要在地图功能中使用它 在减少功能?
我有同样的问题(R 崩溃与规则的大型数据集),你可以使用 Mahout,它是 Hadoop 之上的机器学习引擎,它有关联规则和其他机器学习算法(如聚类......