Regex从数据中检索票证编号



我有一个调查结果数据集,需要提取其中一个答案的票号。

数据

survey  question   response
S1         Q10       A2345677Public
S1         Q10       https://tt.test.com/V123456
S1         Q10       [V987657]

我需要数据成为

survey  question   response
S1         Q10       A2345677
S1         Q10       V123456
S1         Q10       V987657

Regex我使用和不工作-:

regexp_substr(response,'/[a-zA-Z]*d+[a-zA-Z0-9]*') 

如果数据是"脏的";在没有结构的情况下以不同的方式(A2345677Public,https://tt.test.com/V123456,[V987657](,使用正则表达式无法解决此问题。例如,您的正则表达式在第一个示例中也将匹配"Public"。

最新更新