一种方法是添加一个名为"one_answers"的列;伪";到df1,然后在df1的所有变量上与df2连接。
我正试图根据df1是否包含在df2中来创建一个伪变量。注意,df2的列数不仅仅是df1中的列数。
例如:
df1:
A | B | |
---|---|---|
1 | ||
4 | 5 | 6 |
7 | 8 | 0 |
df1$dummy <- 1
library(dplyr)
dplyr::left_join(df2, df1) %>%
mutate(dummy = ifelse(is.na(dummy), 0, dummy))
# Joining, by = c("A", "B", "C")
# A B C D dummy
# 1 2 3 E 1
# 4 5 6 F 1
# 7 8 9 G 0
默认情况下,left_join使用所有常用变量进行联接,但可以根据需要进行修改。