16s rRNA分析有标准流程吗



我试图重现这篇论文的树状图结果,涉及特定的16s rRNA分析。

但我不知道是否有标准的数据管理或数据分析方法。所以,我一直在自己尝试。以下是摘要。

在方法部分中说:;生成的FASTQ文件存放在https://www.ncbi.nlm.nih.gov/bioproject/PRJNA386442.随后,使用ea utils v11.2和标准设置合并MiSeq配对末端原始序列正向和反向读取,然后从QIME v19.1中进行分离文库步骤,去除短于200个核苷酸的序列读取、包含模糊碱基的读取或平均质量分数小于30的读取">

因此,我使用SRATOOLKIT下载了sra文件,并在终端使用了以下代码:

for n in {141..188}; do prefetch "SRR5577$n"; done

后来,我使用转换为fastq文件

for n in {141..188}; do fastq-dump "SRR5577$n"; done

但是,对于合并步骤,我不能使用github上ea-utils包中的fastq-join函数或任何其他函数。数据的格式似乎不正确。

我做得好吗?我在哪里可以了解更多关于这种分析的信息?

我建议在fastq转储中使用--split-files,例如:

for n in {141..188}; do fastq-dump --split-files "SRR5577$n"; done

看起来数据是成对的。否则就不需要合并它们。它将为您提供单独的正向和反向读取文件,这些文件可能是您输入到ea-util的。

相关内容

  • 没有找到相关文章

最新更新