在大查询上正向前看的替代方案-匹配最后一个分隔符之前的所有内容



我目前正在清理url,我想获得最后一个斜杠("/")之前的所有内容

这是一个示例字符串:https://www.businessinsider.de/gruenderszene/plus-angebot/?tpcc=onsite_gs_header_nav& verification_code = DOVCGF75J8LSID

,我要提取的部分是:https://www.businessinsider.de/gruenderszene/plus-angebot

对于正常的RegEx,使用.*(?=/)

非常简单你可以在regex101.com上看到

你能帮我在BigQuery上复制这个吗,因为他们不允许向前看/向后看?

我可能会把它描述为一个regex替换,它删除了最后一个路径分隔符和path:

SELECT url, REGEXP_REPLACE(url, r'/[^/]+$', '') AS url_out
FROM yourTable;

如果您想明确指定一个最后的路径分隔符,后面紧跟着一个查询参数,那么使用:

SELECT url, REGEXP_REPLACE(url, r'/?[^/]+$', '') AS url_out
FROM yourTable;

相关内容

最新更新