r语言 - 使用'by'和条件替换数据表中的行值



我正在尝试根据分组中另一列中的条件替换一列中的某些行值。

编辑

编辑以突出问题的递归性质。

例如

DT = data.table(y=rep(c(1,3), each = 3)
            ,v=as.numeric(c(1,2,4,4,5,8))
            ,x=as.numeric(rep(c(9:11),each=2)),key=c("y","v"))
DT
   y v  x
1: 1 1  9
2: 1 2  9
3: 1 4 10
4: 3 4 10
5: 3 5 11
6: 3 8 11
在每个"y"中,我想将"x"

的值替换为"x",其中"v"具有观察值v+t(例如t = 3),用2222(或实际上是函数的结果)替换为以下结果:

   y v  x
1: 1 1  9
2: 1 2  9
3: 1 4 2222
4: 3 4 10
5: 3 5 11
6: 3 8 2222

我已经尝试了以下内容,但无济于事。

  DT[which((v-3) %in% v), x:= 2222, y][]

它神秘地(?)导致:

   y v  x
1: 1 1  9
2: 1 2  9
3: 1 4 2222
4: 3 4 2222
5: 3 5 2222
6: 3 8 2222

运行:

DT[,print(which((v-3) %in% v)), by =y]

表示它在组中执行正确的索引,但是我不明白会发生什么(或缺乏)。

您可以

尝试使用replace(这可能会产生一些开销,因为它会复制整个x

 DT[, x:=replace(x, which(v %in% (v+3)), 2222), by=y]
 #   y v    x
 #1: 1 1    9
 #2: 1 2    9
 #3: 1 4 2222
 #4: 3 4   10
 #5: 3 5   11
 #6: 3 8 2222

或者,您可以创建一个逻辑索引列,然后在下一步中执行分配

 DT[,indx:=v %in% (v+3), by=y][(indx), x:=2222, by=y][, indx:=NULL]
 DT
 #   y v    x
 #1: 1 1    9
 #2: 1 2    9
 #3: 1 4 2222
 #4: 3 4   10
 #5: 3 5   11
 #6: 3 8 2222

或者使用 .I 稍微修改您自己的方法以创建索引

indx <- DT[, .I[which((v-3) %in% v)], by = y]$V1
DT[indx, x := 2222]

最新更新