蛋白质编码基因正则表达式



我正在尝试编写一个可以匹配以下说明的正则表达式 带有"AT"前缀的字符序列,后跟"nG",其中 n 是从 1 到 5 的数字,然后是"G",最后后跟 5 个数字的后缀。

注意:只是普通的正则表达式,不特定于语言。

匹配字符串的一个示例如下:"AT1G01040">

这是我可以构建AT[1-5]G(d{1,5})但我不确定它是否是正确的答案。

拜托,我需要你的手,谢谢。

如果末尾的位数可能从 1 到 5,您可以使用

^AT[1-5]G[0-9]{1,5}$

请参阅正则表达式演示。

请注意,如果末尾的位数必须正好为 5,则必须删除1,

^AT[1-5]G[0-9]{5}$

  • ^- 字符串的开头
  • AT- 字符AT序列
  • [1-5]-12345
  • G-G
  • [0-9]{1,5}- ASCII 数字的任何 1 到 5 次连续出现(或者 - 如果您使用{5}- 正好出现 5 次(
  • $- 字符串的结尾。

最新更新