在Julia中,如何将函数应用于包含数组的数据帧



我希望能清楚地回答这些问题,但让我在这里更好地解释我:我有这个数据帧:

m = DataFrame(
x = [1,2,3],
y = [[1,2,3],[4,5,6],[7,8,9]])

我的目标是获得列z,它是每个y数组的平方加上对应于列中位置的x字符串。也许你可以这样得到:

m = DataFrame(
x = [1,2,3],
y = [[1,2,3],[4,5,6],[7,8,9]],
z = [[2,5,10],[18,27,38],[52,67,84]])

我可以使用以下代码在R中完成:

m <- m %>% mutate(z = map2(x,y, ~map2_dbl(.x,.y, ~ (.x + .y^2))))

朱莉娅身上有类似的东西吗?问候

在DataFrames.jl master(即将发布(上,您可以使用transform函数:

julia> using DataFrames
julia> m = DataFrame(x = [1,2,3], y = [[1,2,3],[4,5,6],[7,8,9]])
3×2 DataFrame
│ Row │ x     │ y         │
│     │ Int64 │ Array…    │
├─────┼───────┼───────────┤
│ 1   │ 1     │ [1, 2, 3] │
│ 2   │ 2     │ [4, 5, 6] │
│ 3   │ 3     │ [7, 8, 9] │
julia> transform(m, [:x, :y] => ByRow((x,y) -> y.^2 .+ x) => :z)
3×3 DataFrame
│ Row │ x     │ y         │ z            │
│     │ Int64 │ Array…    │ Array…       │
├─────┼───────┼───────────┼──────────────┤
│ 1   │ 1     │ [1, 2, 3] │ [2, 5, 10]   │
│ 2   │ 2     │ [4, 5, 6] │ [18, 27, 38] │
│ 3   │ 3     │ [7, 8, 9] │ [52, 67, 84] │

这样的东西应该可以工作:

julia> using DataFrames
julia> m = DataFrame(
x = [1,2,3],
y = [[1,2,3],[4,5,6],[7,8,9]])
3×2 DataFrame
│ Row │ x     │ y         │
│     │ Int64 │ Array…    │
├─────┼───────┼───────────┤
│ 1   │ 1     │ [1, 2, 3] │
│ 2   │ 2     │ [4, 5, 6] │
│ 3   │ 3     │ [7, 8, 9] │
julia> m.z = map(eachrow(m)) do row
row.x .+ row.y .^ 2
end
3-element Array{Array{Int64,1},1}:
[2, 5, 10]
[18, 27, 38]
[52, 67, 84]
julia> m
3×3 DataFrame
│ Row │ x     │ y         │ z            │
│     │ Int64 │ Array…    │ Array…       │
├─────┼───────┼───────────┼──────────────┤
│ 1   │ 1     │ [1, 2, 3] │ [2, 5, 10]   │
│ 2   │ 2     │ [4, 5, 6] │ [18, 27, 38] │
│ 3   │ 3     │ [7, 8, 9] │ [52, 67, 84] │

但我认为避免在这里使用匿名函数,而只创建一个常规函数可能会更清楚(更可读(:

# Define the function that works on one dataframe row
julia> f(x, y) = y.^2 .+ x
f (generic function with 1 method)
julia> f(1, [1,2,3])
3-element Array{Int64,1}:
2
5
10
# And broadcast (map) it to all rows
julia> m.z = f.(m.x, m.y)
3-element Array{Array{Int64,1},1}:
[2, 5, 10]
[18, 27, 38]
[52, 67, 84]
julia> m
3×3 DataFrame
│ Row │ x     │ y         │ z            │
│     │ Int64 │ Array…    │ Array…       │
├─────┼───────┼───────────┼──────────────┤
│ 1   │ 1     │ [1, 2, 3] │ [2, 5, 10]   │
│ 2   │ 2     │ [4, 5, 6] │ [18, 27, 38] │
│ 3   │ 3     │ [7, 8, 9] │ [52, 67, 84] │

最新更新