i将有关(生物(序列的信息存储在数据帧中,最后一列["seq"]只包含空字符串
id length start end flank ... seq
0 QHMTJXYKWXRUKMQ 235 0 235 0 ...
1 QOODMXKFPXOWNRH 255 27 227 55 ...
2 ISVULHIYLPIIVFW 285 74 285 74 ...
...
并具有带有ID和相应序列的Dict
{'QOODMXKFPXOWNRH': 'GCTTCTCGTGGAGTGAGTACGGTGTGCCTTCAAACTCTACTCCCACTAATAGCTTTTTGATGCCTTCTAGCAAGCCTCGCTAACCTCGACTTACCCCCCACTCTTAACCTACTGGGAGAACTCTCTGTGCTAGTAACCACGTTCTCCTGATCAAATATCACTCTCCTACTTACAGGACTCAACATACTAGTCACAGCCCTATACTCCCTCTACATATTTACCACAACCCCATCCAGCATCCAACTCAGACTACAG', 'ISVULHIYLPIIVFW': 'GAGCGAGACTCCGTCTCAAAAAAAAAGAAGAAATACATTGGTTTGGTCCAGAAAGGTGGGACGACTCAAAGGGCGGGGGGTTGGGAGGGGGTCGGAGGAAAAGGTTGGGGAACAGCTCAATAGGTTGTTGTTGATTTGGTTAAAAAATAGTAGAGGGATGATGCTAATAATTAGGCTGTGGGTGGTTGTGTTGATTCAAATTATGTGTTTTTTGGAAAGTCATGTCAGTGGTAGTAATATAATTGTTGGGACGATTAGTTTTAGCATTGGAGTAGGTTTAGGTTA',...}
现在,我尝试在Dict./Dataframe上进行迭代,并将序列添加到数据帧中的ID(如果Dict..包含该特定ID(。
使用map
:
df['id'].map(dictionary)