为什么协会规则学习被视为一种有监督的学习方法



有人可以向我解释,为什么协会规则学习被视为一种有监督的学习方法?我理解的方式是,该算法采用了基于这些集合的一堆相干数据集并计算关联:

{a, b, c}
{a, b, d}
=> a -> b
=> b -> a

我看到的方式,只有任意数据集。没有特定的目标向量。为什么被称为监督?

我想如果将Association rule learning视为unsupervisedsupervised learning task,我想这是一个开放的讨论。虽然维基百科将其算作有监督的学习算法的组,而其他资源则将其计算为无监督学习算法的类别:

而不是决策树和规则集归纳,这导致 分类模型,关联规则学习是无监督的 学习方法,没有分配给示例的类标签。

机器学习和数据挖掘-Springer

我想这取决于如何实现实际学习部分。一个人可以创建training data - label对的数据集,例如您的示例:

{a, b, c}
{a, b, d}
=> a -> b
=> b -> a

拥有几百或数千对,可以训练神经网络以相当准确地了解数据集中的基本模式。然后,这将是Supervised Learning task,NN从预先定义的示例中学习。

另一方面,如果实现算法的方式,则基于以下方式计算关联的方式:支持 - 置信度 - 置信度 - 升降 - 信念,它将是Unsupervised Learning task

这取决于:如果您只是在分类数据之间搜索关联(无需提前指定先例和成功(,那么显然是 un> un> un superpervised。典型的应用是购物车分析。但是,有一些工具(例如SPSS Modeler(可以指定一个合适的成功(或者"如果您愿意的话,"目标"如果您愿意(,让算法(例如,Apriori(搜索该指定的成功的先例。例如,搜索flag数据字段员工损耗(是/否(的先例。在这种情况下,协会非常类似于分类,因此应理解为受监督的学习。简而言之,如果您不在ML-Tool中定义目标/成功,则无监督协会,但是,如果您指定了它,则对其进行监督。如果您接受此功能,请建立一种混合方法,取决于您的应用方式。

相关内容

最新更新