我有几个样本中特定目标区域的pcr扩增快速q文件。对于每个样本,我想知道与下面发布的参考序列#1或#2更一致的读数的百分比。我应该如何开始解决这个问题,什么工具是最好的对齐?
我正在使用2X150运行的Illumina配对端适配器序列。两个参考扩增子分别为173和179 bp:
1: aaaaagtataaatataggaccaggcagagcattttatacaacaggagaaataataggagatataagacaagcacattgtaaccttagtagagcaaaatggaatgacactttaaataagatagttataaaattaagagaacaatttgggaataaaacaatagtctttaagcact
2: aaaaagtatccgtatccagaggggaccagggagagcatttgttacaataggaaaaataggaaatatgagacaagcacattgtaacattagtagagcaaaatggaatgccactttaaaacagatagctagcaaattaagagaacaatttggaaataataaaacaataatctttaagcaat
我们想知道一种病毒在感染后是否会基于这两种序列之间的差异而战胜另一种病毒;也就是与#1最对齐的百分比和与#2最对齐的百分比
谢谢你,萨拉
- 将参考放大器转换为
fasta
格式 - 选择对准器,如
bwa mem
、bowtie2
等 - 为您选择的校准器索引参考。
- 使用您选择的校准器将读数对齐到参考。
- 使用
samtools idxstats
查找与每个扩增子对齐的读取数。
指出:
- 在对齐读取之前,从读取中修剪适配器通常是一个好主意。存在许多好的适配器修剪器,如
flexbar
、skewer
等。 - 上面提到的许多流行的生物信息学软件包都可以很容易地安装,例如使用
conda
。
引用:
conda
bwa
bowtie2
samtools
flexbar
skewer