R-使用Multidplyr时如何用多列分开



tl; dr
如何从多列上拆分"分区"?

动机:
我对使用32个核心中的1个进行勤奋总结感到不满意,因此我试图使用多用途我在多列上操作。

示例:
小插图通过单列显示分组,但是当我这样做时,我的其他分组列不被考虑。

代码:

library(dplyr)
library(multidplyr)
library(nycflights13)
flights1 <- partition(flights, flight)
flights2 <- summarise(flights1, dep_delay = mean(dep_delay, na.rm = TRUE))
flights3 <- collect(flights2)

那么在年,月和一天分裂怎么办?

这对我不起作用:

flights1 <- partition(flights, list(year, month, day))
flights2 <- summarise(flights1, dep_delay = mean(dep_delay, na.rm = TRUE))
flights3 <- collect(flights2)

我似乎无法完成这项工作。您能指出正确或至少有效的方法吗?

根据 ?partitionpartition的用法是

partition(.data, ..., cluster = get_default_cluster())

其中 ...是要分区的变量。与其传递变量列表,不如分别传递每个变量,即

partition(flights, year, month, day)

相关内容

  • 没有找到相关文章

最新更新