VCF文件的最高质量分数是多少?



有人知道最大VCF质量分数是否在某个地方明确定义?

Thanks in advance:)

我有一个包含大约830万个变量的VCF文件。我想知道VCF文件中的质量分数是否有限制。我发现的最高质量是999。我的VCF文件中大约有20%的质量分数是999,所以我假设这是最大值。我只是不确定,想用这些信息来写我的毕业论文。

在vcf规范https://samtools.github.io/hts-specs/VCFv4.2.pdf中没有定义质量的最大值,并且所有不同的变体调用者将以不同的方式管理它。然而,这在实践中不是问题,因为人们永远不会以如此高的置信度应用过滤器。你真正应该问的问题是我能接受的最低分数是多少。不幸的是,这个问题没有一个通用的答案,因为它取决于测序技术,管道和应用。也就是说,过滤掉质量分数低于30的变体是一种常见的策略,在各种场景中都能很好地工作,使用比这个值高得多的值是不常见的。

最新更新