我正在使用在kmodes包中实现的称为k原型聚类的k均值变体,当分类数据和数值数据混合时有效。
https://github.com/nicodv/kmodes
如何为此找到适当数量的集群?
kmode 中适当数量的集群可以用与 KMean 中相同的方式找到。轮廓系数的技术可用于kmode。但是metric
不应用作euclidean
cosine
而是可以使用指标。