R设置新列中的值，其他列中的值= 1

您可能在Kaggle中认识到这一点。我有多个列，从Soil_Type1一直到Soil_Type40。如果土壤类型不存在，则值为0，如果存在，则值为1。每行只能有一种土壤类型。

我想创建一个新列，如果Soil_Type1 = 1，则取值S1，如果Soil_Type2 = 1，则取值S2，等等。我可以用蛮力，也就是每次一行。有没有办法循环这个?

train_raw[,16:53 := lapply(.SD, as.character), .SDcols =16:53 ]
train_raw[,Soil_Type := "" ]
train_raw[Soil_Type1 == 1, Soil_Type := "S1"]
train_raw[Soil_Type2 == 1, Soil_Type := "S2"]
train_raw[Soil_Type3 == 1, Soil_Type := "S3"]
train_raw[Soil_Type4 == 1, Soil_Type := "S4"]

编辑:

对不起，这就是你所说的可复制的例子吗?

train_raw <- data.table(Soil_Type = "", 
                        Soil_Type1 = c(0,0,0,1), 
                        Soil_Type2 = c(0,0,1,0), 
                        Soil_Type3 = c(1,1,0,0))
train_raw[,Soil_Type := "" ]

感谢David Arenburg的回答。

train_raw[, Soil_Type := "" ]
indx <- which(names(train_raw) == "Soil_Type")
cols <- paste0("Soil_Type", 1:4)
for(j in 1:length(cols))
   set(train_raw,which(train_raw[[cols[j]]] == 1L), 
       j = indx, value = paste0("S", j))

相关内容

最新更新

热门标签：