从R中选择使用空间数据(LON,LAT)的DBSCAN中的EP和分布



我知道以前的帖子已经解决了此主题,但是我找不到任何专门用于空间点数据。我有一个数据集,该数据集在2013年在纽约市发生。我试图识别停止发生的地方的"热点"。数据以这种形式:

stops <- data.frame(lon=c(-74.00478, -74.01046, -74.00521),
                    lat=c(40.71641, 40.71153, 40.72063),
                    precinct = c(1,1,1))

还有其他功能(总计= 89),例如停止时间,可疑种族,理性停止等。总共有173,671个观察结果。

我的问题是采用KNN方法来查找EPS,我必须改变LAT和LON还是可以按原样使用它们?

我还有另一个问题是如何选择分子?我已经观看了其他有关Python和R与Tableau Integration的犯罪数据的教程,似乎他们是根据某些事件数量选择的。我使用此代码获得了与一天内发生的平均停止次数有关的分布,但是我不确定这是否可靠。

stops2013clean %>%
group_by(precinct, lubridate::hour(stops2013clean$time)) %>%
summarise(n_stops=n()) %>%
summarise(mean(n_stops)) %>%
summarise(mean(`mean(n_stops)`))

感谢您的任何帮助和指导。

没有算法可以选择它们。这是关于 you 想做的问题。

在纬度和经度的情况下,您应该使用距离距离,以获取米,院子,脚,如您所愿(只要确保您知道自己得到的单位)。

然后必须决定什么是"热点"。哪几个半径犯罪?100米以内的10次犯罪?然后您有参数。

最新更新