r语言 - 如何对地理数据进行密度聚类?



我想使用基于密度的算法对地理数据(坐标,至少高度(进行聚类。我发现DBSCAN应该非常适合我的目的。我甚至想拥有最小值为 1 或 2 的小型独立集群。它完成了这项工作,但将其他点保留为一个巨大的集群或噪音,我希望它们也聚集成更小的组。

例如,如果我有两组高点(如山脉(位于地图上的不同位置,我希望它们位于两个单独的聚类中。如何实现这一点?也许以某种方式在算法中设置最大点值?我感谢任何建议。

附言我为此目的使用了R,但问题更多的是关于方法。

不要使用太小的minpts。

1 或 2 个点不是"集群"。这些点是"噪音"。只需将噪声中的所有点视为单独的聚类,或者如果您真的愿意,可以在足够短的距离内连接这些点。您可以轻松地对噪声进行后处理。

但出于密度基础聚类的目的,您需要更多点才能具有密度。事实上,对于最多 2 个最小值,DBSCAN 会退化为单链路集群。

最新更新