R arules:标记重复项集

  • 本文关键字:arules r arules
  • 更新时间 :
  • 英文 :


我正在基于主题对数据集进行定性编码。每个观察允许有两个主题,因此我有两列具有相同的变量列表。当我运行arules时,它会看到";v1=α;v2=β;作为不同于";v1=β;v2=α"如下所示,

|V1|V2|

|--------|-----|

|α|β|

这是我的代码:

pr_itemset<-apriori(
pr_trans,parameter=list(
target="frequent",support=.001,minlen=2,maxlen=4))

这两行不同。如果你真的希望项目是ALPHA和BETA,而没有V1和V2,因为每一行代表一组项目,那么你应该从一个集合列表(表示为字符向量(开始。代码如下所示:

library("arules")
mysets <- list(
c('ALPHA', 'BETA'),
c('BETA', 'ALPHA')
)
trans <- transactions(mysets)
inspect(trans)
items        
[1] {ALPHA, BETA}
[2] {ALPHA, BETA}
identical(trans[1], trans[2])
[1] TRUE

相关内容

  • 没有找到相关文章

最新更新