我在 R 中使用性别包,不幸的是,当该包中的性别函数无法将名称分类为男性或女性时,它会返回空白的 tibbles。
有没有一种"咕噜咕噜"式的方式来应用性别函数,以便在我的输出中将大小为 n x m 的空 tibbs 替换为大小为 n x m 的 NA,以保持性别函数的输入和输出的行大小相等?
我想找到一个不涉及为性别函数编写包装器的解决方案(如果可能的话(。
我会通过将名称存储在数据框列中,然后将gender()
的结果连接回原始数据来解决这个问题。
例如:
library(gender)
mydata <- data.frame(name = c("Neil", "Askey"), stringsAsFactors = FALSE)
merge(mydata, gender(mydata$name), all = TRUE)
结果:
name proportion_male proportion_female gender year_min year_max
1 Askey NA NA <NA> NA NA
2 Neil 0.9964 0.0036 male 1932 2012