我经常发现自己使用同一数据表上的:=
进行了一系列链式计算。例如,类似这样的东西
test = data.table(1:10, 1:10, 1:10, 1:10)
test[, V1 := V1^2]
test[, V2 := V1*V2]
test[, V3 := V2/V3]
test[, V4 := sqrt(V3)]
test[, new := letters[V4]]
必须在每行上写test[, ...]
1)键入时间更长(我可以解决这个问题不是一个大问题)。但是,更重要的是,也从视觉上分散了计算的流量和内容。我宁愿写
test[, {
V1 := V1^2
V2 := V1*V2
V3 := V2/V3
V4 := sqrt(V3)
new := letters[V4]
}]
,但这引发了You have wrapped := with {} which is ok but then := must be the only thing inside {}
的错误。
我知道我可以写
within(test, {
V1 = V1^2
V2 = V1*V2
V3 = V2/V3
V4 = sqrt(V3)
new = letters[V4]
})
但这失去了使用:=
我尝试编写一个功能来提供此功能
with.dt = function(dt, expressions){
e = strsplit(expressions,'n')
for (i in 1:length(e)){
dt[, eval(parse(text = e[i]))]
}
dt
}
with.dt(test, "
V1 := V1^2;
V2 := V1*V2;
V3 := V2/V3;
V4 := sqrt(V3);
new := letters[V4];
")
但这不会更改数据的内容。表
是否有任何语法允许within
版本的整洁外观,同时保留:=
的参考属性分配?
有几种不同的方法可以做到这一点。
此处使用的原始测试矩阵:
v1 v2
1: 1 3
2: 2 4
首先,我们可以做这样的事情:
test[,`:=`(v1 = v1^2,
v2 = v1*v2)
输出:
v1 v2
1 3
4 8
或,如果我们愿意依次完成它,我们可以使用弗兰克的黑客。
test[, `:=`(v1 = v1 <- v1^2, v2 = v2 * v1)]
输出:
v1 v2
1 3
4 16
或同样,我们可以运行此操作:
test[,c("v1","v2") := list(v1^2,v1^2*v2)]
输出:
v1 v2
1 3
4 16
我们可以使用列表表达式列表的函数:
with.dt = function(dt, expr){
for (j in 1:length(expr)) set(dt, , names(expr)[j], dt[, eval(expr[[j]])])
}
test = data.table(1:10, 1:10, 1:10, 1:10)
with.dt(test, expression(
V1 = V1^2,
V2 = V1*V2,
V3 = V2/V3,
V4 = sqrt(V3),
new = letters[V4]
))
# V1 V2 V3 V4 new
# 1: 1 1 1 1 a
# 2: 4 8 4 2 b
# 3: 9 27 9 3 c
# 4: 16 64 16 4 d
# 5: 25 125 25 5 e
# 6: 36 216 36 6 f
# 7: 49 343 49 7 g
# 8: 64 512 64 8 h
# 9: 81 729 81 9 i
#10: 100 1000 100 10 j