r语言 - 如何识别不显示两个数据集之间链接的数据?



Dataset1:

id1  id2  abc  n  
1  111  yes  2    
2  121  no   1   
3  122  yes  2  
4  224  no   2    
5  441  no   3   
6  665  yes  1     

数据集2:

id1  id2  age gen  
1  111  45  m   
1  111  46  f  
2    1  52  f  
121  122  41  f    
121  122  44  m  
4  224  54  f  
4  221  56  m  
5  441  44  m  
5  441  45  f  
5  441  58  f    
6  665  54  f    

我有两个数据集。两者都通过id1id2链接。如何从无法链接的两个数据集中识别这些数据???

我们可以使用 dplyr 包中的anti_join来过滤不匹配的行。

library(dplyr)
Dataset1_anti <- Dataset1 %>% anti_join(Dataset2, by = c("id1", "id2"))
Dataset1_anti
#   id1 id2 abc n
# 1   2 121  no 1
# 2   3 122 yes 2
Dataset2_anti <- Dataset2 %>% anti_join(Dataset1, by = c("id1", "id2"))
Dataset2_anti
#   id1 id2 age gen
# 1   2   1  52   f
# 2 121 122  41   f
# 3 121 122  44   m
# 4   4 221  56   m

数据

Dataset1 <- read.table(text = "id1  id2  abc  n  
1  111  yes  2    
2  121  no   1   
3  122  yes  2  
4  224  no   2    
5  441  no   3   
6  665  yes  1  ",
header = TRUE, stringsAsFactors = FALSE)
Dataset2 <- read.table(text = "id1  id2  age gen  
1  111  45  m   
1  111  46  f  
2    1  52  f  
121  122  41  f    
121  122  44  m  
4  224  54  f  
4  221  56  m  
5  441  44  m  
5  441  45  f  
5  441  58  f    
6  665  54  f ",
header = TRUE, stringsAsFactors = FALSE)

最新更新