我正在尝试学习一些数据挖掘和机器学习方面的实践技术。我刚刚实现了一个 k 均值聚类算法,据我所知它工作正常。我知道它会在数据中找到以前不知道结构的模式,但我的问题是,我现在可以用这些信息做什么?我想将我的代码带到下一步,所以我很好奇 - 一旦我有一堆文档的 k 个集群,这如何帮助我理解数据?我可以用这些新发现的信息做什么?更具体地说,我正在寻找一个编码项目,它将把我的集群实现提升到一个新的水平。
k 均值和其他聚类算法对项目进行分组,并提供有关文档集的完整信息,然后聚类可用于
- 查找相关文档
- 简要介绍您的套装
当您使用不同的指标和不同的集群时,您可以向用户提供这样的视图或图表
http://blog.cluster-text.com/tag/cluster/