如何在 Pig 中使用正则表达式将一个表达式替换为另一个表达式



我正在使用正则表达式tu提取名称:

" REGISTER piggybank.jar
A = LOAD 'table_DHCP' USING org.apache.hcatalog.pig.HCatLoader();
B = foreach A  generate REGEX_EXTRACT_ALL (name,'.*-(.*).engtp.dz$');
dump B; "

表达式之前是这样的:departement-name.engtp.dz,我使用正则表达式仅提取 colomn 名称中的名称,但是现在我想用正则表达式给我的表达式替换"departement-name.engtp.dz",那么我该如何使用正则表达式做到这一点呢?!请

使用替换函数,如果你熟悉Java,在Pig中替换只是在Java中实现的替换。

然后使用捕获组引用:

REPLACE(name, '.*-(.*).engtp.dz$', '$1');

最新更新