我有许多坐标点,每个坐标点都与一个特定的地标相关联,但它们的精度各不相同,未知。对于每一个地标,我都有游客说他们"在地标"时的坐标。
我想使用"在地标"坐标来提高地标的准确性,以供未来的游客使用。然而,当我改变聚类算法的参数时,我真的无法知道我是否在提高对现有位置进行实际改进的可能性。
我想创建一个目标函数,我可以用它来代替这个——有什么想法吗?
请注意,谷歌地图API调用可能是不可靠的,因为不完善的地标地址。
一个例子是高斯混合模型的后验。你可以在这里找到一些例子:https://ch.mathworks.com/help/stats/clustering-using-gaussian-mixture-models.html
当然还有其他聚类算法。你在用哪一个?
如果您想将所有这些用户标记减少到一个坐标,我建议(除了日期线(只使用中值。
原因是中位数有一个非常高的分解点,即它对异常值是稳健的。