Java拆分正则表达式非贪婪匹配不起作用



为什么非贪婪匹配对我不起作用?举以下例子:

public String nonGreedy(){
   String str2 = "abc|s:0:"gef";s:2:"ced"";
   return str2.split(":.*?ced")[0];
}

在我看来,结果应该是:abc|s:0:"gef";s:2,但却是:abc|s

正则表达式中的.*?匹配除n之外的任何字符(0次或更多次,匹配的次数尽可能少)。

你可以试试正则表达式:

:[^:]*?ced

另一方面,您应该使用常量模式来避免每次都重新编译表达式,比如:

private static final Pattern REGEX_PATTERN = 
        Pattern.compile(":[^:]*?ced");
public static void main(String[] args) {
    String input = "abc|s:0:"gef";s:2:"ced"";
    System.out.println(java.util.Arrays.toString(
        REGEX_PATTERN.split(input)
    )); // prints "[abc|s:0:"gef";s:2, "]"
}

它的行为符合预期。非贪婪匹配将尽可能少地匹配,并且根据您的输入,要匹配的最小字符是下一个ced的第一个冒号。

您可以尝试限制使用的字符数。例如,将术语限制为"最多3个字符:

:.{0,3}ced

要使其尽可能接近ced,请使用负向前看,使用以下regex:

:(?!.*:.*ced).*ced

这样可以确保没有更接近ced的冒号。

最新更新