我目前正在清理url,我想获得最后一个斜杠("/")之前的所有内容
这是一个示例字符串:https://www.businessinsider.de/gruenderszene/plus-angebot/?tpcc=onsite_gs_header_nav& verification_code = DOVCGF75J8LSID
,我要提取的部分是:https://www.businessinsider.de/gruenderszene/plus-angebot
对于正常的RegEx,使用.*(?=/)
非常简单你可以在regex101.com上看到
你能帮我在BigQuery上复制这个吗,因为他们不允许向前看/向后看?
我可能会把它描述为一个regex替换,它删除了最后一个路径分隔符和path:
SELECT url, REGEXP_REPLACE(url, r'/[^/]+$', '') AS url_out
FROM yourTable;
如果您想明确指定一个最后的路径分隔符,后面紧跟着一个查询参数,那么使用:
SELECT url, REGEXP_REPLACE(url, r'/?[^/]+$', '') AS url_out
FROM yourTable;