如何使用正则表达式查找文件中所有出现的'CDS'?



我正试图查看我的文件,以找到它显示"CDS"的总次数,我想为此使用regex。我是python的新手,想试试这个。

我试过使用re.findall(r'CDS'(,但不起作用

我的文件示例是:

gene            10887..10960
/gene="ileT"
CDS            10887..10960
/gene="ileT"
/product="tRNA-Ile"
/note="codon recognized: AUC; ileT, tRNA-Ile, anticodon
gat, length = 74"
/anticodon=(pos:10921..10923,aa:Ile,seq:gat)
gene            11112..11184
/gene="alaT"
CDS            11112..11184
/gene="alaT"

所以在这里,我期待2。

我不知道我做错了什么:任何帮助都是了不起的!

re.findall()第一个参数应该是您要查找的模式,第二个参数是您要查看的string(文件(。

它应该是这样的:

occurences = re.findall('CDS', yourFile)

这是一个有用的资源和一些例子。

最新更新