嗨,所以我在循环浏览数据框并根据抑制 = 1 的条件删除列时遇到问题。因此,循环需要遍历 df1 的每一列,并删除同一变量的列 suppress = 1。它需要确定抑制 = 1 的特定行在两个 df 中具有相同的变量。
所以有两个数据框。df1 包含所有数据,df2 包含基于 df1 变量的条件。
df1 <- data.frame("ID" = c(1,2,3,4,5), "Age" = c(19,50,46,32,28))
df2 <- data.frame("Variable" = c("ID", "Age"), "Suppress" = c(1,0))
我遇到的主要问题是,当我制作 df1 和 df2 等数据帧时,我当前拥有的循环适用于,但不适用于导入 csv 文件并使用该数据时。
可能是数据框的格式,还是需要调整循环以适用于 csv 导入?我怀疑是后者。
这是我目前拥有的循环:
for(i in names(df1)){
if(df2$Variable == names(df1[i]) & df2$Suppress == 1){
df1[i] <- NULL
}
}
另一个版本...本质上相同
for(i in names(df1)){
if(df2$Variable %in% names(df1[i]) & df2$Suppress == 1){
df1[i] <- NULL
}
}
我不能在这里发布 csv,但我建议尝试使用类似于 df1 和 df2 的导入 csv 文件运行上述代码。
注意:df1 和 df2 都将作为 csv 文件导入。
回顾:为什么当前循环不适用于导入的 csv 数据,以及基于 df2 的抑制变量删除列的替代方法是什么。
谢谢
我相信您发布的代码中的逻辑不正确,您应该将df2$Variable
的每个值与names(df1)
进行比较。
for(i in seq_along(nrow(df2))){
if(df2$Variable[i] %in% names(df1) && df2$Suppress[i] == 1){
df1[i] <- NULL
}
}
df1
# Age
#1 19
#2 50
#3 46
#4 32
#5 28
下面是一种完全没有循环的矢量化方式。
inx <- (names(df1) %in% df2$Variable) & (df2$Suppress == 1)
df1[!inx]
# Age
#1 19
#2 50
#3 46
#4 32
#5 28