我的数据目前显示为按每个地区排序的年龄和性别的频率表(以下是几行的示例(
地区 | 年龄 | 性别人口 | |
---|---|---|---|
1 | 0 | M | 114 |
1 | 0 | F | 87 |
1 | 1 | M | 36 |
1 | 1 | F>54 |
使用tidyverse
,您可以执行类似的操作(未在实际数据上进行测试(。。。
library(dplyr)
df %>% group_by(Region) %>%
summarise(M = sum(population[gender == "M"]),
F = sum(population[gender == "F"]),
Total = sum(population),
under30 = sum(population[age<30]),
over30 = sum(population[age>=30]))
如果您有任何丢失的数据,您可能希望在sum
语句中添加na.rm = TRUE
作为选项。