我担心我的r/rstudio出了问题。我正在尝试做一个inner_join()
,以获取BabyNames包装中男性和女性婴儿名称的交集,但是看到我的inner_join()
大于我的男性名称的子集,并具有以下代码:
library(babynames)
library(dplyr)
malenames <- babynames %>%
filter(sex=="M")
girlnames <- babynames %>%
filter(sex=="F")
names <- inner_join(girlnames, malenames, by ="name")
要澄清,我看到了786372的行,用于棒球名的行和1138293行的女孩名称。可能出了什么问题?谢谢您的指导。
您需要在姓名和年份上加入,否则girlnames
中的每个(年名(对与 malenames
中的每个行都匹配。
names <- inner_join(girlnames, malenames, by = c("name", "year"))