我有一个装运目的地的表。我有一个固定的起始点(也很晚,很长)。我想用聚类找到其他最优原点位置。换句话说,我想分配一个簇质心(保持它固定)并找到1,2,3…N个其他簇质心。这是可能的scikit学习集群模块吗?
与其为此回收聚类,不如将其视为常规的优化问题。你不想"发现结构",但优化成本。
请注意地球不是平的,欧几里得距离(即k-means)是一个坏主意。北纬1度在赤道与东经1度的距离大致相同。如果你的数据是在纽约,你有一个不可忽略的失真,你的解决方案甚至不会是局部最优。
如果你执意要滥用kmeans,那很容易。
随机选择n-1个中心和预定义的中心。然后只运行1次k均值迭代。然后将该中心再次替换为所需的中心。