R-使用点过程模型进行预测



我正在分析救护车事件数据。该数据集涵盖了三年,大约有250000起事件。初步分析表明,事件分布与种群分布有关。使用SPATSTAT拟合点过程模型与此相符,并且在部分残留图中具有广泛的一致性。但是,人们认为,在"社交时间"(星期五,星期六晚上,公共假期)中,这种趋势与人口相关的趋势有所不同。

我想获取数据的子集,看看它们与总图片有何不同。我如何解释由于数据子集固有固有的点数较小的强度差异?

还是有一种方法可以直接将我的拟合模型用于总图片?

很难提供数据,因为存在隐私问题,并且由于数据集的大小,很难模拟情况。我绝不是统计学家,因此我在这里有点骗人。我有
的副本"空间点模式的方法和用R的应用"非常有用。

我将尝试使用伪代码来解释我的方法。

250k_pts.ppp <- ppp(the_ambulance_data x and y, the_window)
1.3m_census_pts <- ppp(census_data x and y, the_window)

通过视觉检查对密度表面的最佳带宽似乎是bw.scott。这用于适合这些点的密度表面。

inc_density <- density(250k_pts.ppp, bw.scott)
pop_density <- density(1.3m_census_pts, bw.scott)
fit0 <- ppm(inc_density ~ 1)
fit_pop <- ppm(inc_density ~ pop_density)
partials <- parres(fit_pop, "pop_density")

绘制部分残差表明,与线性拟合的一致性是可以广泛接受的,其中某些区域是"摇摆"。

我要做的接下来要做的事情:

the_ambulance_data %>% group_by(day_of_week, hour_of_day) %>% 
select(x_coord, y_coord) %>% nest() -> nested_day_hour_pts

获取以下列表项目之一并创建PPP,例如fri_2300hr_ppp;

fri23.den <- density(fri_2300hr_ppp, bw.scott)
fit_fri23 <- fit(fri_2300hr_ppp ~ pop_density)

然后,如何将此PPP或密度与更广泛的模型进行比较?我可以进行特征测试,例如分散,聚类。.我可以比较 fit_popfit_fri23的部分残差?

我如何控制点数对密度的效果 - 即我有250k点与子集中的8000点。我在想可能是密度表面的分位数吗?

将标记附加到代表关注的子集/类别的救护车数据(例如'忙'vs'non-busy')。对于非正式或非参数分析,请使用relrisk之类的工具,或使用split.ppp分离不同类型的点后使用density.splitppp。要进行正式分析(考虑到样本量等),您应该将多个候选模型拟合到相同的数据,一个具有繁忙/无用效果的模型,另一个模型没有这种效果,然后使用anova.ppm正式测试是否存在繁忙/非偶然的效果。请参阅所述书的第14章。

最新更新