>我有一个数据框,我使用 k 均值聚类将其聚类为 3 个聚类。
现在,我想从每个聚类中找到前 10 个中心值。
如何使用python来做到这一点?
因此,在找到 3 个集群后意味着你有 3 个质心,它们只不过是 3 个 数据点或
大小的向量 ->输入数对吧?
因此,您还将数据集的数据点与其聚类编号隔离。对于聚类 1 的 10 个最近点,求聚类 1 和质心 1 中的点之间的距离。并按距离降序对它们进行排序并提取前 10 个点。
同样,对于所有 3 个集群。
例:
centroid1 : (1,2)
points in cluster 1: (2,3) (4,5) (1,1) (2,0) (3,4)
前2点是:(1,1) (2,3).
根据他们的距离。