如何计算每个潜在变量的出现次数并找到它们在R中的比例?

  • 本文关键字:计算 何计算 变量 r
  • 更新时间 :
  • 英文 :


最终,我试图找到每个子组中每个潜在变量的比例。

我有一个大数据帧(Patient1),有108.720行,包括:

  • 因子变量Majority_SNP(可以是A, T, C, G或dash)
  • 索引位置(1 ~ 9.060)
  • 很多很多其他的东西

我最终想做一个图表,显示a, T, C, G的相对频率,破折号是"Majority_SNP"按索引位置。比如:

0.150.2500.350.25

此代码将data.frame发送到table,但table与矢量

一起工作
Patient1 %>%
table(Majority_SNP)

另一种方法是使用magrittr

中的$运算符
Patient1 %$%
table(Majority_SNP)

Orwithfrom R Base

with(Patient1 , table(Majority_SNP))

如果我们需要在dplyr函数之外的列上使用table,则pull为列

library(dplyr)
Patient1 %>%
pull(Majority_SNP) %>%
table

或与.$

Patient1 %>%
table(.$Majority_SNP)

最新更新