在Python sklearn KMeans(请参阅文档)中,我想知道当将形状为(n,n_features)的ndarray
传递给init
参数时,内部会发生什么,当n<n_clusters
- 它是否删除给定的质心并仅启动kmeans++初始化,这是
init
参数的默认选择?(PDF文件kmeans++)(kmeans++是如何工作的) - 它是否考虑给定的质心,并使用kmeans++相应地填充剩余的质心
- 它是否考虑了给定的质心,并使用随机值填充剩余的质心
我没想到这个方法在这种情况下不会返回任何警告。这就是为什么我需要知道它是如何管理的。
如果您给它一个不匹配的init
,它将调整集群的数量,正如您从源代码中看到的那样。这没有文档记录,我认为这是一个错误。我会建议修复它。