我正在使用teradata,其中有以下格式的数据多次出现:
*6A*H.ORTHO I
*4A*IMP
*16A*T.IMPLANTS
*2A*HIMPLANTS
*9A*IMP
*5A*F.IMPLANT
*6A*DIMP
*4A*TISSUE
*5A*KIMP
*7A*IMP
*10A*D.IMP
*3A*W.LSH
*10A*IMP
*16A*IMP
*22A*T.IMPLANTS
在上面的数据集中,我试图提取第二次出现星号之后的所有内容。如d.p p、d.p p、t.p imses、f.p nse等。
我尝试使用SUBSTR,并接近使用:
SUBSTR(TRIM(FSS.Surgical_Inventory_Code),1,
INDEX(TRIM(FSS.Surgical_Inventory_Code),'*')-1)
但是,它只返回第一个*之后的数据。
我认为解决问题的最佳解决方案是使用REGEX表达式或SUBSTR。teradata中有一个名为REGEXP_SUBSTR的函数。我不太确定如何创建一个REGEX语句来解决我的问题。
如果你的字符串中只有两个星号,你可以使用STRTOK:
strtok(<source string>,'*',2)