如何通过正则表达式识别法律上的公司名称



意大利法律正式发表在《官方公报》上,我正试图用以下正则表达式来识别公司名称:

azienda|societa's+([ws-]+) ha

与等片段匹配良好

Vista la domanda presentata in data 26 febbraio 2021 con  la  quale
la societa' Orpha-Devel Handels Und  Vertriebs  GMBH  ha  chiesto  la
riclassificazione dalla classe C(nn) alla  classe  H  del  medicinale
«Tresuvi» (treprostinil) relativamente alle confezioni aventi  A.I.C.
n. 049207032, 049207044, 049207018 e 049207020;

返回字符串";Orpha Devel Handels Und Vertriebs GMBH";在匹配组中。在这种情况下;完美的";我只希望后面的空格(通常是一两个(不包括在返回的匹配组中。

您可以使用

(?:azienda|societa)'s+(w+(?:[s-]+w+)*)s+ha
(?:azienda|societa)'s+(.*?)s+ha

请参阅regex演示#1和regex演示#2。

请注意,您应该将aziendasocieta分组,或者,捕获组将只与societa匹配,而不与azienda匹配。

详细信息

  • (?:azienda|societa)-aziendasocieta
  • '-一个'字符
  • s+-一个或多个空白
  • (w+(?:[s-]+w+)*)-第1组:一个或多个单词字符,然后一个或几个空格/连字符的零次或多次重复,然后一一个或更多个单词字符
  • (.*?)-第1组:除换行符之外的任何零个或多个字符,尽可能少
  • s+-一个或多个空白
  • haha字符串

最新更新