i具有253行(Mbps中的染色体上的位置(和1列(每个位置的等位基因得分(。我需要产生一个数据框,其中包含染色体上每0.5 Mbps的等位基因评分的平均值。请帮助可以执行此操作的R代码。谢谢。
在这种情况下,图片足以构建答案,但不足以支持测试。您应该学会以不需要手动重新输入的形式发布数据。(这就是为什么您正在积累负票的原因。(
基本R策略将是使用cut
创建分组变量,然后使用循环构造来累积并应用平均功能。大概这是在一个数据框架中,我将假定它被命名为特定的 my_alleles
:
tapply( my_alleles$Allele_score, # act on this vector
# in groups defined by this factor
cut(my_alleles$Location,
breaks=seq(0, max(my_alleles$Location), by=0.5)
),
# with this function
FUN=mean)