将 URL 产品着陆页与混合文本和数字匹配,同时排除产品变体

  • 本文关键字:数字 排除 混合 URL 陆页 文本 regex
  • 更新时间 :
  • 英文 :


我们有一个消费者网站,我只需要查看产品着陆页的流量并排除所有产品变体。我真的很接近,无法完全关闭循环。

如果我有这些作为示例模式:

产品/产品一<溴 />产品/产品二<溴 />产品/产品-3<溴 />产品/产品一/30盎司产品/产品一/60盎司产品/产品二/组合包装
产品/产品二/小瓶-7毫升<溴 />产品/产品-3/20盎司

我可以排除所有变体,但我无法弄清楚如何保留一个产品登录页面,即产品/产品-3。

products/[w.*/]((?![1-9]|combo).)*$

并且要做到我们拥有大量媒体合作伙伴的事实,链接可能是产品/产品-3 或产品/产品-3/

任何帮助,不胜感激。

你可以试试这个正则表达式:^products/[^/]+/?$.它将匹配任何形式products/xxx后跟尾随/或什么都没有。在正则表达式 101 上演示。

最新更新