我找到了正则表达式来定位所有连字符和"撇号"单词:
(?=S*['-])([a-zA-Z'-]+)
示例:装备和行动导向
经过一番搜索,我不知道如何利用这些信息来获得我想要的东西。。。
尝试此regex
(?<=b)[,.'-:"]+(?=s|$)|"
演示:https://regex101.com/r/mDhl17/1/
以下是的一些细节
- 此正则表达式将以带有单词边界标记的
Positive Lookbehind
开头,以排除前面有字母的任何标点符号 - 我们在
[,.'-:"]+
之后添加目标标点符号。你可以将你喜欢捕捉的任何东西添加到列表中 - 我们希望标点符号后面跟一个空格,或者在句子
(?=s|$)
的末尾 - 一个例外是引号
" "
,我们想在它们出现的时候抓住它们,所以我在末尾添加了OR |
条件