我可以在regex引擎dk.brics.automatic中使用Unicode吗



我想在正则表达式中使用Unicode。

例如,RegExp="\u0061"与"a"匹配。但似乎dk.brics.automatic不支持这一点。结果是匹配"u0061"。我还尝试了RegExp="\u0061"和RegExp="\\u0061"。没有一个会起作用。

如果你对这个工具有任何经验,你能给我一些解决方案吗?

谢谢!

最后,我找到了一种绕过这个问题的方法。

首先,我们可以在Java代码中使用Unicode,但它必须单独创建。例如String str = "u0061"+"b";String str = "u0061b";工作不好。

其次,如果我们想从文本文件中读取字符串,比如包含"u0061bu0063"的test.txt,我们必须(据我所知)手动用相应的符号替换Unicode,因为它们是混合的。然后我们可以得到值为"abc"的String str

我在dk.brics.automato方面没有任何经验,但我想RegExp类的常见问题解答和JavaDoc中都有提到。

据我所知,您可以使用unicode字符,但必须将它们表示为字符("a"),而不是使用u0061表示法。

最新更新