我正在尝试转换从NCBI下载的包含细菌基因组组的文件。为了进一步分析,我需要将其转换为FASta格式。
我尝试通过seqkit转换,但它不工作。
.fsa_nt
扩展名表示文件已经是FASTA格式。NCBI GenBank发布说明将.fsa_nt
文件描述为"Nucleotide fasta"。
从NCBI下载的典型文件扩展名为.fsa_nt.gz
。这些文件已经是FASTA格式,用gzip压缩。您可以使用gunzip
或zcat
解压它们。
例如,在*nix系统中,您可以这样下载并解压缩.fsa_nt.gz
文件:
curl ftp://ftp.ncbi.nlm.nih.gov/sra/wgs_aux/LN/TK/LNTK01/LNTK01.1.fsa_nt.gz | gunzip > LNTK01.1.fasta