我尝试到处寻找,但似乎没有任何效果。我正在尝试对包含纬度和经度的 902,538 个数据点进行聚类,但我似乎无法使其工作!我已经尝试了各种聚类方法,但不明白什么不起作用。有什么提示吗?
dfnypd 是一份犯罪报告,其中包括给定时间范围内纽约所有报告犯罪的纬度和经度。
这是我尝试过的代码之一 - 给我一个 ValueError:n_samples=2 应该是>= n_clusters = 100
dfnypd = dfnypd[['Latitude','Longitude']].apply(pd.to_numeric)
clat = dfnypd['Latitude']
clon = dfnypd['Longitude']
from sklearn.cluster import KMeans
X = np.array(([clat, clon]))
kmeans = KMeans(n_clusters = 100, random_state = 0).fit(X)
我将其分组,以便我可以将它们绘制在可读的图表上,并根据在这些集群中犯下的罪行为不同的集群分配权重。我尝试将其全部绘制为热图,但它需要太多的功能。
Folium 本身有一个集群插件,可以在您放大和缩小时动态聚类您的标记:
folium的插件MarkerCluster。