意大利法律正式发表在《官方公报》上,我正试图用以下正则表达式来识别公司名称:
azienda|societa's+([ws-]+) ha
与等片段匹配良好
Vista la domanda presentata in data 26 febbraio 2021 con la quale
la societa' Orpha-Devel Handels Und Vertriebs GMBH ha chiesto la
riclassificazione dalla classe C(nn) alla classe H del medicinale
«Tresuvi» (treprostinil) relativamente alle confezioni aventi A.I.C.
n. 049207032, 049207044, 049207018 e 049207020;
返回字符串";Orpha Devel Handels Und Vertriebs GMBH";在匹配组中。在这种情况下;完美的";我只希望后面的空格(通常是一两个(不包括在返回的匹配组中。
您可以使用
(?:azienda|societa)'s+(w+(?:[s-]+w+)*)s+ha
(?:azienda|societa)'s+(.*?)s+ha
请参阅regex演示#1和regex演示#2。
请注意,您应该将azienda
和societa
分组,或者,捕获组将只与societa
匹配,而不与azienda
匹配。
详细信息:
(?:azienda|societa)
-azienda
或societa
'
-一个'
字符s+
-一个或多个空白(w+(?:[s-]+w+)*)
-第1组:一个或多个单词字符,然后一个或几个空格/连字符的零次或多次重复,然后一一个或更多个单词字符(.*?)
-第1组:除换行符之外的任何零个或多个字符,尽可能少s+
-一个或多个空白ha
—ha
字符串