K 表示文档聚类 - 下一步是什么



我正在尝试学习一些数据挖掘和机器学习方面的实践技术。我刚刚实现了一个 k 均值聚类算法,据我所知它工作正常。我知道它会在数据中找到以前不知道结构的模式,但我的问题是,我现在可以用这些信息做什么?我想将我的代码带到下一步,所以我很好奇 - 一旦我有一堆文档的 k 个集群,这如何帮助我理解数据?我可以用这些新发现的信息做什么?更具体地说,我正在寻找一个编码项目,它将把我的集群实现提升到一个新的水平。

k 均值和其他聚类算法对项目进行分组,并提供有关文档集的完整信息,然后聚类可用于

  1. 查找相关文档
  2. 简要介绍您的套装

当您使用不同的指标和不同的集群时,您可以向用户提供这样的视图或图表

http://blog.cluster-text.com/tag/cluster/

最新更新