我需要询问有关在Java String中删除括号和其中的文本的问题。例如,我有
String str = "I am a new (Software) Engineer"
现在的问题是,如何在不使用的情况下删除这里的子字符串"(软件)"
str.replace("(software)", "")
因为可能在下一个字符串中,我会得到"我是一个新的(电气)工程师"或"(机械)"或类似的东西。
那么我该怎么做,我认为一种方法是获取"("和")"的索引并使用该索引删除/替换它们,但我希望会有一些更短的方法可以做到这一点
使用正则表达式匹配括号中的任何内容:
str = str.replaceAll("\(.*?\) ?", "");
请注意,括号必须进行转义,转义字符本身必须在 String 中进行转义,因此使用双反斜杠。
术语 .*?
是一个不情愿的匹配,这意味着如果输入中有两个带括号的术语,它不会一直跳到最后一个括号,即"a (foo) b (bar) c"如果使用.*
,它会变成"a c",因为它会消耗从第一个开括号到最后一个右括号的所有内容。
我在末尾添加了一个可选空格,因此一旦删除中间术语,您就不会留下两个相邻的空格。
实际上,最有效和万无一失的方法是遍历整个字符串并检查括号。它只需要一次扫描。
您还必须跟踪打开和关闭的括号数量,以确保算法对于outside (a text (in another) parenthesis) outside again
这样的句子是正确的,这应该会导致outside outside again
。
或多或少地这样做的代码。
public class RemoveParenthesis {
public static void main(String[] args) {
int open = 0;
int closed = 0;
boolean changed = true;
int startIndex = 0, openIndex = -1, closeIndex = -1;
String text = "outside (a text (in another) parenthesis) outside again";
System.out.println("before: " + text);
while (changed) {
changed = false;
for (int a = startIndex; a < text.length(); a++) {
if (text.charAt(a) == '(') {
open++;
if (open == 1) {
openIndex = a;
}
} else if (text.charAt(a) == ')') {
closed++;
if (open == closed) {
closeIndex = a;
text = text.substring(0, openIndex)
+ text.substring(closeIndex + 1);
changed = true;
break;
}
} else {
if (open == 0)
startIndex++;
continue;
}
}
}
System.out.println("after: " + text);
}
}
public static String removeBracketContents(String response) {
char ch;
StringBuilder sb = new StringBuilder();
Stack<Character> stack = new Stack<Character>();
System.out.println("before removeBracketContents: " + response);
for (int i = 0; i < response.length(); i++) {
ch = response.charAt(i);
switch (ch) {
case '(':
stack.push(new Character(ch));
break;
case ')':
if (stack.isEmpty())
return response;
else
stack.pop();
break;
default:
if (stack.isEmpty())
sb.append(ch);
break;
}
}
System.out.println("after removeBracketContents: " + sb.toString());
if (!stack.isEmpty()) {
System.out.println("Missing ) at end");
System.out.println("after removeBracketContents: " + response);
return response;
} else {
System.out.println("after removeBracketContents: " + sb.toString());
return sb.toString();
}
}