我想比较两个对象,每个对象在R中有5个字符串。为简单起见,我们可以考虑旧等级和新等级。输入将是:
new <- c("XX1","XX2", "XX3", "XX4", "XX4")
old <- c("XX1","XX5", "XX6", "XX3", "XX4")
这将是预期的输出:
Keep <- c("XX1", "XX3", "XX4")
Get <- c("XX2", "XX4")
Rid <- c("XX5", "XX6")
为清楚起见,"XX1"、"XX3"和"XX4"保留在新排名中。但是,"XX4"现在出现两次,并在Get
对象中沿着"XX2"弹出。 Rid
不是在新等级中,而是在旧等级中。
我可以使用以下命令提取Rid
:
library(Hmisc)
Rid <- old[old%nin%new]
但是,当字符串出现不止一次时,例如这里的"XX4",我发现很难提取(即 Get
)。我很乐意提出任何建议。
可以使用
包vecsets
的功能
#Keep
vecsets::vintersect(new, old)
#[1] "XX1" "XX3" "XX4"
#Get
vecsets::vsetdiff(new, old)
#[1] "XX2" "XX4"
#Rid
vecsets::vsetdiff(old, new)
#[1] "XX5" "XX6"