小贝子编程

r语言 - 无监督离散化，用于将连续转换为分类，以进行频繁的项目集挖掘

本文关键字：行频分类项目转换 r语言离散化连续用于 r transactions cluster-analysis arules discretization
更新时间 : 2023-09-11
英文 : r - Unsupervised discretization to convert continuous into categorical for frequent item set mining

我正在使用包'arules'在我的大数据中挖掘频繁的项目集，但我找不到合适的离散化方法。

作为包"arules"中的示例，可以在函数"离散化"中使用几种基本的无监督方法，但我想估计我的大数据集中类别的最佳数量，这似乎比分配类别数量更合理。

你能给我很好的建议吗，谢谢。

@Michael·哈斯勒

我认为对于无监督离散化几乎没有指导。查看每个变量的直方图并手动决定。对于 k 均值，您可以使用策略通过内部验证技术(即肘法(找到 k。对于监督离散化，有一些方法可以帮助您做出决定。也许其他人可以在这里提供帮助。

相关内容