1022 32119234588 111701109
我正在尝试连接两个数据集,一个用于崩溃数据,另一个用于按区域划分的人口。崩溃数据如下所示,有7个区域。假设数据是这样的,命名为"crash ">
小我认为这样做的一种方法是通过建立一个小区域到大区域的转换向量,并使用它在population中添加一个区域列,您可以对该列进行分组,使区域人口和它们成为表的连接。
small_region <- c('Christchurch', 'Selwyn', 'Ashburton', 'Timaru',
'Queenstown-Lakes', 'Central Otago', 'Clutha')
small_to_big <- structure(c(rep("canterbury", 4), rep("Oregon", 3)),
names = small_region)
population %>%
mutate(region = small_to_big[TA]) %>%
group_by(region) %>%
summarise(Population = sum(Population)) %>%
right_join(crashes, by = "region")