使用模式分割文本



我正在编写一个脚本,它可以帮助我们用特定的模式(逗号+ ")拆分文本。";+大写字母)。所以,我做正则表达式:partt = re.compile(r'b, [A-Z]')然后,我拆分遵循此模式的文本,当我这样做时,大写字母被排除在外,这不是我正在寻找的预期结果。

的例子:

target_string = 'Prueba1, palabra 1, Palabra 2, palabra 3, palabra 4, Palabra5 frase1'
patt = re.compile(r'b, [A-Z]')
print(patt.split(target_string))
Result: ['Prueba1, palabra 1', **'alabra 2**, palabra 3, palabra 4', **'alabra5 frase1'**]
Expected result: ['Prueba1, palabra 1', 'Palabra 2, palabra 3, palabra 4', 'Palabra5 frase1']

我希望你能帮我修改我的脚本。

大写字母必须是" looking ahead ";——一个不包含在返回的匹配字符串中的要求。

patt = re.compile(r'b, (?=[A-Z])')

最新更新