我在Julia 1.4(DataFrames 0.22.1(中有一个GroupedDataFrame
。我想迭代行组来计算一些统计信息。因为有很多组,而且计算速度很慢,所以我想用多线程来完成这项工作。
代码
grouped_rows = groupby(data, by_index)
for group in grouped_rows
# do something with `group`
end
有效,但是
grouped_rows = groupby(data, by_index)
Threads.@threads for group in grouped_rows
# do something with `group`
end
得到CCD_ 2。有没有一种方法可以在DataFrame行组上并行化迭代?
您需要有一个AbstractVector
才能使Threads.@threads
工作。
因此,收集您的grouped_rows
Threads.@threads for group in collect(SubDataFrame, grouped_rows)
# do something with `group`
end