我想知道如何在summarise
中对数据进行分组后进行筛选。我在下面创建了两个专栏。理想情况下,我希望将summary中的seasonTotal
列过滤为大于3的值,然后根据过滤后的计数计算homeRunsPerSeason。
再版如下:
library(Lahman)
library(tidyverse)
data <- Lahman::Batting
data <- data %>%
filter(yearID > 2015)
grouped_data <- data %>%
group_by(playerID) %>%
summarise(seasonTotal = n(),
homeRunsPerSeason = sum(HR / seasonTotal)
)
将要完成的每个步骤分开。计算季节总数,过滤,然后汇总。
grouped_data <- data %>%
group_by(playerID) %>%
mutate(seasonTotal = n()) %>%
filter(seasonTotal > 3) %>%
summarise(homeRunsPerSeason = sum(HR / seasonTotal))