R-使用点过程模型进行预测

我正在分析救护车事件数据。该数据集涵盖了三年，大约有250000起事件。初步分析表明，事件分布与种群分布有关。使用SPATSTAT拟合点过程模型与此相符，并且在部分残留图中具有广泛的一致性。但是，人们认为，在"社交时间"（星期五，星期六晚上，公共假期）中，这种趋势与人口相关的趋势有所不同。

我想获取数据的子集，看看它们与总图片有何不同。我如何解释由于数据子集固有固有的点数较小的强度差异？

还是有一种方法可以直接将我的拟合模型用于总图片？

很难提供数据，因为存在隐私问题，并且由于数据集的大小，很难模拟情况。我绝不是统计学家，因此我在这里有点骗人。我有
的副本"空间点模式的方法和用R的应用"非常有用。

我将尝试使用伪代码来解释我的方法。

250k_pts.ppp <- ppp(the_ambulance_data x and y, the_window)
1.3m_census_pts <- ppp(census_data x and y, the_window)

通过视觉检查对密度表面的最佳带宽似乎是bw.scott。这用于适合这些点的密度表面。

inc_density <- density(250k_pts.ppp, bw.scott)
pop_density <- density(1.3m_census_pts, bw.scott)
fit0 <- ppm(inc_density ~ 1)
fit_pop <- ppm(inc_density ~ pop_density)
partials <- parres(fit_pop, "pop_density")

绘制部分残差表明，与线性拟合的一致性是可以广泛接受的，其中某些区域是"摇摆"。

我要做的接下来要做的事情：

the_ambulance_data %>% group_by(day_of_week, hour_of_day) %>% 
select(x_coord, y_coord) %>% nest() -> nested_day_hour_pts

获取以下列表项目之一并创建PPP，例如fri_2300hr_ppp;

fri23.den <- density(fri_2300hr_ppp, bw.scott)
fit_fri23 <- fit(fri_2300hr_ppp ~ pop_density)

然后，如何将此PPP或密度与更广泛的模型进行比较？我可以进行特征测试，例如分散，聚类。.我可以比较 fit_pop和 fit_fri23的部分残差？

我如何控制点数对密度的效果 - 即我有250k点与子集中的8000点。我在想可能是密度表面的分位数吗？

将标记附加到代表关注的子集/类别的救护车数据（例如'忙'vs'non-busy'）。对于非正式或非参数分析，请使用relrisk之类的工具，或使用split.ppp分离不同类型的点后使用density.splitppp。要进行正式分析（考虑到样本量等），您应该将多个候选模型拟合到相同的数据，一个具有繁忙/无用效果的模型，另一个模型没有这种效果，然后使用anova.ppm正式测试是否存在繁忙/非偶然的效果。请参阅所述书的第14章。

相关内容

最新更新

热门标签：