r语言 - 使用Dplyr按组计算百分比为每列没有指定名称?



与此类似。然而,我感兴趣的是计算每一列的百分比。例如,当我执行下面的操作时,我可以通过显式列出列S1来计算列S1,但是我想要一种方法来对所有列执行此操作,而无需指定它。

input <- 'Gene  Exon    S1  S2  S3
G1  E1  56  52  95
G1  E2  25  52  5
G1  E3  32  66  22
G2  E1  55  11  33
G2  E2  46  12  44'
df = read.table ( text=input, header=T)
df$Exon = NULL 
df %>% group_by(Gene) %>% summarise ( per = S1 / sum (S1) ) 

上面的将总结S1的百分比,但是当我试着使用它引起的句号和错误。

df %>% group_by(Gene) %>% summarise ( per = . / sum (.) ) 

thanks in advance.

您可以使用across:

library(dplyr)
df %>%
group_by(Gene) %>%
summarize(across(matches("^S[0-9]+"), ~ . / sum(.)), .groups = "drop") 
# # A tibble: 5 x 4
#   Gene     S1    S2     S3
#   <chr> <dbl> <dbl>  <dbl>
# 1 G1    0.496 0.306 0.779 
# 2 G1    0.221 0.306 0.0410
# 3 G1    0.283 0.388 0.180 
# 4 G2    0.545 0.478 0.429 
# 5 G2    0.455 0.522 0.571 

最新更新