sklearn.cluster.KMeans如何处理缺少质心(可用质心小于n_clusters)的init ndarra



在Python sklearn KMeans(请参阅文档)中,我想知道当将形状为(n,n_features)的ndarray传递给init参数时,内部会发生什么,当n<n_clusters

  1. 它是否删除给定的质心并仅启动kmeans++初始化,这是init参数的默认选择?(PDF文件kmeans++)(kmeans++是如何工作的)
  2. 它是否考虑给定的质心,并使用kmeans++相应地填充剩余的质心
  3. 它是否考虑了给定的质心,并使用随机值填充剩余的质心

我没想到这个方法在这种情况下不会返回任何警告。这就是为什么我需要知道它是如何管理的。

如果您给它一个不匹配的init,它将调整集群的数量,正如您从源代码中看到的那样。这没有文档记录,我认为这是一个错误。我会建议修复它。

相关内容

  • 没有找到相关文章

最新更新