我使用的是这里提供的文档集群代码。我知道k-means是在解决一个非凸问题,因此每次运行它时优化的结果都会不同,但有没有办法使聚类可重复(可能通过固定一些随机种子)?
您可以修复K-means的random_state参数。在以下代码中,我使用42:
km = KMeans(n_clusters=true_k, init='k-means++', max_iter=100, n_init=1,
verbose=opts.verbose,
random_state = 42)
您可以在此处查看文档。