KMean 是否在 sklearn 中自动规范化特征



我想知道 KMeans是否在进行聚类之前自动规范化特征。似乎没有选项可以提供输入来要求规范化。

区分数据预处理(规范化、分箱、加权等)和机器学习算法应用。使用sklearn.preprocessing进行数据预处理。此外,数据可以由不同的预处理器进行链式预处理。

至于 K 均值,通常仅归一化均值是不够的。一种是沿不同特征对数据均衡方差进行归一化,因为 K 均值对数据方差敏感,而方差较大的特征更强调结果。因此,对于K-means,我建议使用StandardScaler进行数据预处理。

不要忘记,k-means 结果对观测值的顺序很敏感,值得多次运行算法,在两者之间打乱数据,平均结果聚类,并以这些平均聚类中心为起点运行最终评估。

相关内容

  • 没有找到相关文章

最新更新