Teradata 正则表达式或 SUBSTR 删除两个 * 和星号之间的文本?



我正在使用teradata,其中有以下格式的数据多次出现:

*6A*H.ORTHO I
*4A*IMP
*16A*T.IMPLANTS
*2A*HIMPLANTS
*9A*IMP
*5A*F.IMPLANT
*6A*DIMP
*4A*TISSUE
*5A*KIMP
*7A*IMP
*10A*D.IMP
*3A*W.LSH
*10A*IMP
*16A*IMP
*22A*T.IMPLANTS

在上面的数据集中,我试图提取第二次出现星号之后的所有内容。如d.p p、d.p p、t.p imses、f.p nse等。

我尝试使用SUBSTR,并接近使用:

SUBSTR(TRIM(FSS.Surgical_Inventory_Code),1,
INDEX(TRIM(FSS.Surgical_Inventory_Code),'*')-1)

但是,它只返回第一个*之后的数据。

我认为解决问题的最佳解决方案是使用REGEX表达式或SUBSTR。teradata中有一个名为REGEXP_SUBSTR的函数。我不太确定如何创建一个REGEX语句来解决我的问题。

如果你的字符串中只有两个星号,你可以使用STRTOK:

strtok(<source string>,'*',2)

相关内容

  • 没有找到相关文章

最新更新