我想对投票数据集进行分类分析。我在UCI存储库中找到了它,但我很难对它进行预处理,以便能够在r中使用arules包。所以数据的部分内容看起来是这样的。
party, voting.issue1, voting.issue2, voting.issue3
republican, n, y, n
republican, n, y, n
democrat, ?, y, y
在使用"read.csv"导入数据后。我试图直接使用它,就像我在"Adult"数据集示例中读取一样,但我得到了错误
"Error in (function (classes, fdef, mtable) :
unable to find an inherited method for function ‘itemFrequencyPlot’ for signature ‘"data.frame"’"
我还尝试过使用excel将整个数据更改为二进制矩阵,即删除党派列,添加带有二进制值的共和党和民主党列,并将其他列中的Y、N和问号分别转换为1、0和NA。我总是犯同样的错误。有人能建议我使用项FrequencyPlot和Apriori函数的任何预编译函数或教程吗。
您可以尝试此解决方案,也可以使用以下代码在事务中强制使用数据帧,然后在itemFrequencyPlot函数中使用它:
trans <- as(df, "transactions")