r-如何使用多列作为键合并两个数据帧

假设我有以下数据帧：

DF1 <- data.frame("A" = rep(c("A","B"), 18),
                  "B" = rep(c("C","D","E"), 12),
                  "NUM"= rep(rnorm(36,10,1)),
                  "TEST" = rep(NA,36))
DF2 <- data.frame("A" = rep("A",6),
                  "B" = rep(c("C","D"),6),
                  "VAL" = rep(c(1,3),3))

*注意：DF2中变量A和B的每个唯一组合都应该有一个唯一的VAL。

对于每一行，如果列A和A中的值匹配，并且列B和B中的值与该行匹配，则我希望将TEST中的NA替换为DF1中的相应值VAL。否则，我会将TEST保留为NA。如果不使用match循环遍历每个组合，我该如何做到这一点？

理想情况下，答案将扩展到两个数据帧，其中有许多列需要匹配。

# this is your DF1    
DF1 <- data.frame("A" = rep(c("A","B"), 18),
                      "B" = rep(c("C","D","E"), 12),
                      "NUM"= rep(rnorm(36,10,1)),
                      "TEST" = rep(NA,36))
#this is a DF2 i created, with unique A, B, VAL
DF2 <- data.frame("A" = rep(c("A","B"),3),
                  "B" = rep(c("C","D","E"),2),
                  "VAL" = rep(1:6))
# and this is the answer of what i assume you want      
tmp <- merge(DF1,DF2, by=c("A","B"), all.x=TRUE, all.y=FALSE)
DF1[4] <- tmp[5]

正如Akrun在评论中提到的，您的查找表（DF2）需要简化为其唯一的A/B组合。对于您当前的数据帧，这不是问题，但如果同一组合有多个可能的值，则需要额外的规则。从那里，解决方案很简单：

DF2.u <- unique(DF2)
DF3 <- merge(DF1, DF2.u, all = T)

请注意，这将生成一个新的数据帧，其中包含一个空的TEST列（所有值NA）和一个从DF2分配的VAL列。要想做你想做的事情（尽可能用VAL代替TEST），这里有一些稍微笨拙的代码：

DF1$TEST <- merge(DF1, DF2.u, all = T)$VAL

编辑：在回答你的问题时，如果有必要，你可以把DF2归结为非常简单的：

DF2$C <- c(1:12) #now unique() won't work
DF2.u <- unique(DF2[1:3])
 A B VAL
1 A C   1
2 A D   3

相关内容

最新更新

热门标签：