我在目录中有更多的 fasta
文件,该文件具有相同的开始但两端:
file1abgff
-----------
file2adferr
------------
file3adfr
----------
file1adcef
-----------
如何将所有文件的开头与目录中的所有文件进行比较,并将匹配项结合在一起与一个新文件(example >file1abgffadcef
)?
此代码似乎解决了您的问题。
假设您有输入文件:
cat input
>file1abgff
>file2adferr
>file3adfr
>file1adcef
这是我的解决方案:
sed 's/[0-9]/& /' input | awk '{a[$1]=($1 in a ? a[$1]"|"$2 : $0)}END{for (i in a){print a[i]}}' | sed 's/ //' | grep "|" | sed 's/|//'
>file1abgffadcef