我可以在regex引擎dk.brics.automatic中使用Unicode吗

我想在正则表达式中使用Unicode。

例如，RegExp="\u0061"与"a"匹配。但似乎dk.brics.automatic不支持这一点。结果是匹配"u0061"。我还尝试了RegExp="\u0061"和RegExp="\\u0061"。没有一个会起作用。

如果你对这个工具有任何经验，你能给我一些解决方案吗？

谢谢！

最后，我找到了一种绕过这个问题的方法。

首先，我们可以在Java代码中使用Unicode，但它必须单独创建。例如String str = "u0061"+"b";而String str = "u0061b";工作不好。

其次，如果我们想从文本文件中读取字符串，比如包含"u0061bu0063"的test.txt，我们必须（据我所知）手动用相应的符号替换Unicode，因为它们是混合的。然后我们可以得到值为"abc"的String str。

我在dk.brics.automato方面没有任何经验，但我想RegExp类的常见问题解答和JavaDoc中都有提到。

据我所知，您可以使用unicode字符，但必须将它们表示为字符（"a"），而不是使用u0061表示法。

相关内容