我仍然没有找到regex问题的解决方案。
案例:
输入-
德意志银行
预期输出:
- 第1组-德意志
- 第2组-Gesellschaftsgeschichte
原因是两个单词加起来超过30个字符,所以它们被分成两组。
最大输入可以是90个字符。
输入和预期输出的更多示例:
输入-
Fachlich geeignet,politisch unzuverlässig。。。
输出-
- Fachlich geeignet,政治
- unzuverlässig
输入-
Neuzeit 私有化文本
输出-
- Textbuch zur
- 私人研究
- Neuzeit
要在最多3个组中获得所需内容,可以使用以下regex:
(b.{1,30}(?=b))(b.{1,30}(?=b))?(b.{1,30}(?=b))?
正则表达式从Word boundary
开始,然后从any
字符的1 to 30
开始匹配,然后查找Word boundary
(确保匹配并拆分Whole Words
(。
此模式为repeated 3 times
(其中最后两个是可选的(。
现在,您可以在3个组中进行匹配,每个索引都可以访问这些组。