python 中包'sklearn.cluster'函数中的术语"随机状态"是什么意思'KMeans'



python kmeans函数中的"随机状态"是什么意思?我试图从Google上找到答案,并引用了 https://scikit-learn.org/stable/modules/generated/sklearn.cluster.kmeans.html p>

带有K-均值Alogrithm的陷阱是它不是最佳的。这意味着,由于问题不是凸(用于优化),因此不确定找到最佳解决方案。

您可能会陷入本地最小值,因此您的算法取决于您的初始化(质心)。为了找到良好最低限度的一个好习惯是用几次初始化重新运行算法并保持最佳结果。

正如其他人所述,random_state使结果可重现,可用于调试

牢记kmeans函数是随机的(即使您以相同的输入值运行函数,结果也可能有所不同)。因此,为了使结果可重复,您可以指定random_state参数的值。

Sklearn的Kmeans功能中的随机状态主要有助于

  1. 如果使用Kmeans 初始化质心,则以与Centroid相同的随机数据点开始。
  2. 如果使用随机初始化,则从与Centroid相同的K随机数据点开始。

当一个人想要在以后的某个时间点重现结果时,这会有所帮助。

random_state:int,随机态实例或无,可选,默认:无如果int,随机数生成器使用的种子随机_STATE是;如果随机态实例,Random_State是随机数生成器;如果没有,则随机数生成器是NP.Random使用的随机态实例。

请参阅:http://scikit-learn.org/stable/modules/generated/sklearn.cluster.kmeans.html

最新更新