为什么协会规则学习被视为一种有监督的学习方法

有人可以向我解释，为什么协会规则学习被视为一种有监督的学习方法？我理解的方式是，该算法采用了基于这些集合的一堆相干数据集并计算关联：

{a, b, c}
{a, b, d}
=> a -> b
=> b -> a

我看到的方式，只有任意数据集。没有特定的目标向量。为什么被称为监督？

我想如果将Association rule learning视为unsupervised或supervised learning task，我想这是一个开放的讨论。虽然维基百科将其算作有监督的学习算法的组，而其他资源则将其计算为无监督学习算法的类别：

而不是决策树和规则集归纳，这导致分类模型，关联规则学习是无监督的学习方法，没有分配给示例的类标签。

机器学习和数据挖掘-Springer

我想这取决于如何实现实际学习部分。一个人可以创建training data - label对的数据集，例如您的示例：

{a, b, c}
{a, b, d}
=> a -> b
=> b -> a

拥有几百或数千对，可以训练神经网络以相当准确地了解数据集中的基本模式。然后，这将是Supervised Learning task，NN从预先定义的示例中学习。

另一方面，如果实现算法的方式，则基于以下方式计算关联的方式：支持 - 置信度 - 置信度 - 升降 - 信念，它将是Unsupervised Learning task。

这取决于：如果您只是在分类数据之间搜索关联(无需提前指定先例和成功(，那么显然是 un> un> un superpervised。典型的应用是购物车分析。但是，有一些工具(例如SPSS Modeler(可以指定一个合适的成功(或者"如果您愿意的话，"目标"如果您愿意(，让算法(例如，Apriori(搜索该指定的成功的先例。例如，搜索flag数据字段员工损耗(是/否(的先例。在这种情况下，协会非常类似于分类，因此应理解为受监督的学习。简而言之，如果您不在ML-Tool中定义目标/成功，则无监督协会，但是，如果您指定了它，则对其进行监督。如果您接受此功能，请建立一种混合方法，取决于您的应用方式。

相关内容

最新更新

热门标签：