机器学习中的无监督分类



聚类(例如:K-means、EM算法等(用于无监督分类,通过使用数据点之间的一些距离测量在数据集中形成聚类

我的问题是:除了聚类之外,我可以使用什么来执行无监督分类以及如何执行?或者,对于无监督分类,除了聚类之外,没有其他选择吗?

编辑:是的,我的意思是k-

简单的答案是否定的,聚类并不是无监督学习下的唯一领域。无监督学习比单纯的集群更广泛。聚类只是无监督学习的一个子领域。

小更正:KNN不是一种聚类方法,它是一种分类算法。你可能是想说k的意思。

无监督学习的本质基本上是学习没有基本事实标签的数据。因此,无监督学习的目标是找到给定数据的表示。非监督学习的应用千差万别,尽管在学术上,该领域确实因其复杂性和构建新事物和/或改进的努力而对研究人员的吸引力较小。

在无监督学习下可以考虑降维,因为你想在较低维度中找到数据的良好表示。它们对于可视化高维数据也很有用。PCA、SNE、tSNE、Isomap等都是这些应用程序的类型。

聚类方法也是一种无监督学习,您希望根据一些距离/差异度量对值进行分组和标记。一些应用可以是K-means、层次聚类等。

生成模型,生成模型对条件概率p(X|Y=Y(进行建模。自GAN发表以来,该领域的研究蓬勃发展(见论文(。GANs可以在不显式查看数据的情况下学习数据分布。方法多种多样,其中GAN,VAE,高斯混合,LDA,隐马尔可夫模型。

你可以在这里阅读更多关于无监督学习的内容。

聚类是一个通用术语,表示数据点将被拆分为类,而没有任何关于真实选择的信息。因此,无论你应用哪种算法,如果它是无监督分类,它都将是一个聚类。

当然,根据案例、数据、问题等,有很多不同的方法。如果你能提供更多关于你的确切任务的上下文,我可以列举一些方法。

最新更新