r-使用:= data.table中的多次



我经常发现自己使用同一数据表上的:=进行了一系列链式计算。例如,类似这样的东西

test = data.table(1:10, 1:10, 1:10, 1:10)
test[, V1 := V1^2]
test[, V2 := V1*V2]
test[, V3 := V2/V3]
test[, V4 := sqrt(V3)]
test[, new := letters[V4]]

必须在每行上写test[, ...] 1)键入时间更长(我可以解决这个问题不是一个大问题)。但是,更重要的是,也从视觉上分散了计算的流量和内容。我宁愿写

之类的东西
test[, {
  V1 := V1^2
  V2 := V1*V2
  V3 := V2/V3
  V4 := sqrt(V3)
  new := letters[V4]
}]

,但这引发了You have wrapped := with {} which is ok but then := must be the only thing inside {}的错误。

我知道我可以写

within(test, {
  V1 = V1^2
  V2 = V1*V2
  V3 = V2/V3
  V4 = sqrt(V3)
  new = letters[V4]
  })

但这失去了使用:=

的效率

我尝试编写一个功能来提供此功能

with.dt = function(dt, expressions){
  e = strsplit(expressions,'n')
  for (i in 1:length(e)){    
    dt[, eval(parse(text = e[i]))]
  }
  dt
  }
with.dt(test, "
  V1 := V1^2;
  V2 := V1*V2;
  V3 := V2/V3;
  V4 := sqrt(V3);
  new := letters[V4];
  ")

但这不会更改数据的内容。表

是否有任何语法允许within版本的整洁外观,同时保留:=的参考属性分配?

有几种不同的方法可以做到这一点。

此处使用的原始测试矩阵:

   v1 v2
1:  1  3
2:  2  4

首先,我们可以做这样的事情:

test[,`:=`(v1 = v1^2,
          v2 = v1*v2)

输出:

v1 v2
 1  3
 4  8

或,如果我们愿意依次完成它,我们可以使用弗兰克的黑客。

test[, `:=`(v1 = v1 <- v1^2, v2 = v2 * v1)]

输出:

v1 v2
 1  3
 4 16  

或同样,我们可以运行此操作:

test[,c("v1","v2") := list(v1^2,v1^2*v2)]

输出:

v1 v2
 1  3
 4 16

我们可以使用列表表达式列表的函数:

with.dt = function(dt, expr){
  for (j in 1:length(expr)) set(dt, , names(expr)[j], dt[, eval(expr[[j]])])
}
test = data.table(1:10, 1:10, 1:10, 1:10)
with.dt(test, expression(
  V1 = V1^2,
  V2 = V1*V2,
  V3 = V2/V3,
  V4 = sqrt(V3),
  new = letters[V4]
))
#     V1   V2  V3 V4 new
# 1:   1    1   1  1   a
# 2:   4    8   4  2   b
# 3:   9   27   9  3   c
# 4:  16   64  16  4   d
# 5:  25  125  25  5   e
# 6:  36  216  36  6   f
# 7:  49  343  49  7   g
# 8:  64  512  64  8   h
# 9:  81  729  81  9   i
#10: 100 1000 100 10   j

相关内容

  • 没有找到相关文章

最新更新