Python遍历字符



我一直在尝试提取ACGT基因组中的一个序列的中值字符串搜索。我的问题是说AAAAAAAA到AAAAAAA C等等,直到我尝试了所有可能的组合。

我创建了两个列表,一个包含A、C、G、T,另一个包含8个字符的序列,每次搜索后都会迭代和交换字符。问题是,我没有测试所有的组合,因为当两个组合同时迭代时,它会跳过一个字母。

有没有什么方法可以轻松地进行AAAAAAAA-AAAAAAA C-AAAAAAA G-AAAAAAA T-AAAAAA CA等等?

使用itertools

itertools.product("ACGT", repeat=8)

如上所述,建议使用itertools,

itertools.product("ACGT", repeat=8) # will work in your case.

使用pyparsing-wikiExamples页面中的regex inverter,反转此regex:[ACGT]{8}。你也可以在UtilityMill尝试在线逆变器,但当生成8个字符的字符串时,这个服务器会超时,但我在允许的时间内成功地获得了最多6个字符。

最新更新