小贝子编程

在烂番茄上的正则表达式URL——排除词干

我想返回一个电视剧的匹配url:

YES: http://www.rottentomatoes.com/tv/falling-skies/

但不是电视剧集或电视剧季

NO: http://www.rottentomatoes.com/tv/falling-skies/s03
NO: http://www.rottentomatoes.com/tv/falling-skies/s12/e01

我目前有以下正则表达式:

match = re.match('(http(s)?://)?(www.)?rottentomatoes.com/tv/.+', url)

匹配上述中的三个。我如何构造正则表达式来只匹配第一个?

使用一个否定的字符类代替.+:

^http://www.rottentomatoes.com/tv/[^/]+/?$

[^/]+匹配任何非斜杠的字符，一次或多次-从tv/到下一个斜杠(或者如果不存在/，则字符串的末尾)的所有内容。

<<p> RegEx演示/strong>

最新更新