我想返回一个电视剧的匹配url:
YES: http://www.rottentomatoes.com/tv/falling-skies/
但不是电视剧集或电视剧季
NO: http://www.rottentomatoes.com/tv/falling-skies/s03
NO: http://www.rottentomatoes.com/tv/falling-skies/s12/e01
我目前有以下正则表达式:
match = re.match('(http(s)?://)?(www.)?rottentomatoes.com/tv/.+', url)
匹配上述中的三个。我如何构造正则表达式来只匹配第一个?
使用一个否定的字符类代替.+
:
^http://www.rottentomatoes.com/tv/[^/]+/?$
[^/]+
匹配任何非斜杠的字符,一次或多次-从tv/
到下一个斜杠(或者如果不存在/
,则字符串的末尾)的所有内容。