r-将值的范围拆分为相同数量的bin

  • 本文关键字:bin 拆分 范围 r cut bins
  • 更新时间 :
  • 英文 :


I的值范围从0.105到15.589,代表基因表达的倍数变化。我试过用把它们分成几个箱子

df$bin <- cut(df$FC, breaks=c(seq(min(df$FC),max(df$FC),length.out = 50)))

给我50个含有不同数量基因的仓,例如4297个基因(它们的倍数变化(落入第一个仓(0.105,0.421](,而只有1个基因落入最后一个仓(15.3,15.6](

有没有一种方法可以将我的折叠变化范围划分为相同组大小的箱子,比如20个。最后一个垃圾箱可能包含不到20个基因,因为它不太可能平均分成20个一组,但这没关系。谢谢

如果你像这样将断点设置为目标向量的分位数,你会得到50个大小相等(大致(的组:

cut(df$FC, quantile(df$FC, probs = seq(0,1,l=51)))

最新更新