如何将读对齐到两个短参考序列，并查看映射到一个或另一个参考的百分比?

我有几个样本中特定目标区域的pcr扩增快速q文件。对于每个样本，我想知道与下面发布的参考序列#1或#2更一致的读数的百分比。我应该如何开始解决这个问题，什么工具是最好的对齐?

我正在使用2X150运行的Illumina配对端适配器序列。两个参考扩增子分别为173和179 bp:

1: aaaaagtataaatataggaccaggcagagcattttatacaacaggagaaataataggagatataagacaagcacattgtaaccttagtagagcaaaatggaatgacactttaaataagatagttataaaattaagagaacaatttgggaataaaacaatagtctttaagcact

2: aaaaagtatccgtatccagaggggaccagggagagcatttgttacaataggaaaaataggaaatatgagacaagcacattgtaacattagtagagcaaaatggaatgccactttaaaacagatagctagcaaattaagagaacaatttggaaataataaaacaataatctttaagcaat

我们想知道一种病毒在感染后是否会基于这两种序列之间的差异而战胜另一种病毒;也就是与#1最对齐的百分比和与#2最对齐的百分比

谢谢你,萨拉

将参考放大器转换为fasta格式
选择对准器，如bwa mem、bowtie2等
为您选择的校准器索引参考。
使用您选择的校准器将读数对齐到参考。
使用samtools idxstats查找与每个扩增子对齐的读取数。

指出:

在对齐读取之前，从读取中修剪适配器通常是一个好主意。存在许多好的适配器修剪器，如flexbar、skewer等。
上面提到的许多流行的生物信息学软件包都可以很容易地安装，例如使用conda。

引用:

conda
bwa
bowtie2
samtools
flexbar
skewer

相关内容

最新更新

热门标签：