带有文件结尾的可选JFlex前瞻

我正试图使用JFlex为Fitnesse编写一个lexer，但在使用WikiWords时遇到了问题(http://fitnesse.org/FitNesse.UserGuide.WikiWord)

我复制了链接的正则表达式，并使用以下正则表达式作为标记：

.                               # Regular character
[A-Z]([a-z0-9]+[A-Z][a-z0-9]*)+ # WikiWord

不过，我在正确拼写ThisIsNotAWikiWord时遇到了问题。它有两个大写字母，所以它不应该被认为是一个正则词。所以我需要添加一个先行检查来检查下一个字符是字母还是数字。类似[A-Z]([a-z0-9]+[A-Z][a-z0-9]*)+ / [^A-Za-z0-9]的东西。

这对于词法分析ThisIsNotAWikiWord来说很好，但它通常会破坏词法分析WikiWords。当词法分析WikiWord时，前瞻没有额外的字符，因此它不匹配。

我想我想要一个可选的展望。如果在这之后有一个角色，那么它最好不是其中之一。但是，如果输入中没有其他字符，让我们进行匹配。

文档让我相信这是不可能的，但我希望这只是我缺少regex-fu。来自文档：

在词法规则中，正则表达式r后面可以跟一个先行表达式。先行表达式是"$"（行尾运算符）或后面跟着任意正则表达式的"/"。在这两种情况下，前瞻性都不会被消耗，也不会被包括在匹配的文本区域中，但在确定哪条规则具有最长的匹配时会考虑它（另请参见4.3.3如何匹配输入）。
在"$"的情况下，r只在输入中的一行末尾匹配。行的末尾由正则表达式\r\n|\r\n|\u2028|\u2029|\u000B|\u000C|\u0085表示。因此，$相当于a/\r|\n|\r\n|\u2028|\u2029|\u000B|\u000C|\u0085。这与[5]中描述的情况有点不同：因为在JFlex$中，它是一个真正的尾随上下文，所以文件结尾不算作行尾。

这里似乎不需要环视。

据我所知，您正在寻找以大写字母开头但可以包含数字的大小写单词，其中一个数字算作小写字母，每个大小写凸起必须只有一个大写字母。如果是这样的话，这个正则表达式应该对你有用：

b((?:[A-Z][a-zd]+){2,})b

(?:部分使括号不被捕获。

[A-Z][a-zd]+确保恰好有一个大写字符后紧跟至少一个写字符。

{2,}强制模式至少重复两次，以便产生至少一个驼峰。

相关内容

最新更新

热门标签：