与此类似。然而,我感兴趣的是计算每一列的百分比。例如,当我执行下面的操作时,我可以通过显式列出列S1来计算列S1,但是我想要一种方法来对所有列执行此操作,而无需指定它。
input <- 'Gene Exon S1 S2 S3
G1 E1 56 52 95
G1 E2 25 52 5
G1 E3 32 66 22
G2 E1 55 11 33
G2 E2 46 12 44'
df = read.table ( text=input, header=T)
df$Exon = NULL
df %>% group_by(Gene) %>% summarise ( per = S1 / sum (S1) )
上面的将总结S1的百分比,但是当我试着使用它引起的句号和错误。
df %>% group_by(Gene) %>% summarise ( per = . / sum (.) )
thanks in advance.
您可以使用across
:
library(dplyr)
df %>%
group_by(Gene) %>%
summarize(across(matches("^S[0-9]+"), ~ . / sum(.)), .groups = "drop")
# # A tibble: 5 x 4
# Gene S1 S2 S3
# <chr> <dbl> <dbl> <dbl>
# 1 G1 0.496 0.306 0.779
# 2 G1 0.221 0.306 0.0410
# 3 G1 0.283 0.388 0.180
# 4 G2 0.545 0.478 0.429
# 5 G2 0.455 0.522 0.571