我正在使用arules
软件包中的apriori
函数来对项目关联进行分析。将结果胁迫到Datframe之后,我注意到在某些情况下可以像这样对输出进行分组:
LHS RHS Support Confidence Lift Count
{Item1, Item2} {Item3} .84 0.99 12.3 6
是否有一种方法可以强制该函数在每次交易中的两个项目之间进行分析并产生相应的支持,置信度等?换句话说,我可以强迫apriori
将上述结果分为以下内容:
LHS RHS Support Confidence Lift Count
{Item1} {Item3} a b c d
{Item2} {Item3} e f g h
apriori中的 maxlen
在挖掘后不充当过滤器。Apriori创建频繁的项目集,从长度1开始,然后是2、3,... maxlen
停止采矿过程。
minlen
是一个过滤器,因为必须首先找到所有较短的频繁项目集。
如果您询问是否可以确定
的支持和信心{Item1} -> {Item3}
{Item2} -> {Item3}
仅使用
的支持和信心{Item1, Item2} -> {Item3}
那么答案是否定的。但是,从Apriori属性中,我们至少知道以下内容:
supp({Item1} -> {Item3}) >= supp({Item1, Item2} -> {Item3})
supp({Item2} -> {Item3}) >= supp({Item1, Item2} -> {Item3})