我试图运行CBA()分类器(包=arulesCBA)在一个由二进制变量(如男人/女人)和有序因素(如年龄组1 - 5)组成的数据框架。在将变量作为因子和有序因子作为数据的data.frame放入CBA()时,我得到了一个错误:
> Error in discretizeDF.supervised(formula, data, method = disc.method) :
> Cannot discretize non-numeric column: GENAGEGROUPQ2Q8_2Q8_3Q8_4FAM_1FAM_2
当我将data.frame强制到事务时:
> trans <- transactions(my.dataframe)
CBA()可以很好地工作,但似乎关于"订单"的信息有序因子丢失了。是否有一种变通方法来保留有序因子中有关层次顺序的信息?也许将它们视为整数(如虹膜数据的示例)?多谢!格里格拉斯卡拉
不幸的是,这是真的。关联规则挖掘中的项目概念不保留项目之间的顺序信息。使用数字作为变通方法并没有多大帮助。数字将离散到桶中,桶再次编码为没有订单信息的商品。