R协会规则APRIORI-抑制项目分组



我正在使用arules软件包中的apriori函数来对项目关联进行分析。将结果胁迫到Datframe之后,我注意到在某些情况下可以像这样对输出进行分组:

 LHS                 RHS        Support        Confidence      Lift        Count
{Item1, Item2}      {Item3}      .84             0.99          12.3          6

是否有一种方法可以强制该函数在每次交易中的两个项目之间进行分析并产生相应的支持,置信度等?换句话说,我可以强迫apriori将上述结果分为以下内容:

 LHS           RHS        Support        Confidence      Lift       Count
{Item1}      {Item3}        a                b            c           d
{Item2}      {Item3}        e                f            g           h

apriori中的 maxlen在挖掘后不充当过滤器。Apriori创建频繁的项目集,从长度1开始,然后是2、3,... maxlen停止采矿过程。

另一方面,

minlen是一个过滤器,因为必须首先找到所有较短的频繁项目集。

如果您询问是否可以确定

的支持和信心
{Item1} -> {Item3}
{Item2} -> {Item3}

仅使用

的支持和信心
{Item1, Item2} -> {Item3}

那么答案是否定的。但是,从Apriori属性中,我们至少知道以下内容:

supp({Item1} -> {Item3}) >= supp({Item1, Item2} -> {Item3})
supp({Item2} -> {Item3}) >= supp({Item1, Item2} -> {Item3})

相关内容

  • 没有找到相关文章

最新更新