如何比较标头文件(FASTA)的一部分并将其放在一个文件中



我在目录中有更多的 fasta文件,该文件具有相同的开始但两端:

file1abgff
-----------
file2adferr
------------
file3adfr
----------
file1adcef
-----------

如何将所有文件的开头与目录中的所有文件进行比较,并将匹配项结合在一起与一个新文件(example >file1abgffadcef)?

此代码似乎解决了您的问题。

假设您有输入文件:

cat input
>file1abgff
>file2adferr
>file3adfr
>file1adcef

这是我的解决方案:

 sed 's/[0-9]/& /' input | awk  '{a[$1]=($1 in a ? a[$1]"|"$2 : $0)}END{for (i in a){print a[i]}}' | sed 's/ //' | grep  "|" | sed 's/|//'
>file1abgffadcef

相关内容

  • 没有找到相关文章

最新更新